半剑飘东半剑西 发表于 2022-11-1 19:13:26

本帖最后由 半剑飘东半剑西 于 2022-11-1 22:04 编辑

不知侠友是否有如同笔者般的感受——非常佩服一位作家,总是希望他是完美的。既然一部小说,95%已是非常完美,

正常的推论是,该作家会把剩下的5% 也保持 完美。


半剑飘东半剑西 发表于 2022-11-1 21:50:54

本帖最后由 半剑飘东半剑西 于 2022-11-11 07:20 编辑


   没有收集齐古籍所有文本,包括传统的“原版薄本”,如何判别

文字真伪?如何判别收尾部分的文字驾驭与初始章回是否一致?

   把笔者的工作向前辈、贤达、俊彦、先驱 汇报如下:

(1)编制计算机程序,包含但不少于 带“干预式”、带“人机对话”、能自动输出
   
   (使用数学概率语言的)真伪判断以及其他重要判断。

(2)程序不仅带若干重要数学子程序,且留有社科常用软件的接口,可随时人工干预调用。

(3)把江南柳《金骷髅》主要版本(可覆盖排除版本)均输入到计算机,其中一个汉字占16个bit,

常用字符如控制符:LF(换行)、CR(回车)、FF(换页),如标点符号,占8bit。

LF、CR、FF与标点符号具有较高响应值,可用于界定句子,断句(子)、断(分)段,更主要是

形成一定的语法结构分类。

   计算机程序读入文本后,借助人工智能子程序,可以输出初步的书籍属性、可拓表格,

包括高频字表、高频词表、高频简略句(类似成语)表,可以再进入输入,得到第二级的输出结果。

   输出作家常用字中高频用词表,借助数学工具,定义1阶词距、2阶词距....

加权n阶词距;定义与新词(输入词)的各种距离。定义作家造句的条件概率。在此基础形成“谓词逻辑”,

为进一步工作奠定基础。

。。。。。。

   其他术语暂时不表。先举例。

   [例A1] 计算机判断《金骷髅》结尾的“死鬼!”、“床戏”为冷门词,且标点符号内仅两个字,

得出2阶词距、加权2阶词距超过“阀值”,因此,输出判断:“死鬼!”、“床戏”非真的概率

达到显著程度。

[例A2] 计算机判断《金骷髅》结尾的“风吹云散,明月照人来”,为非对仗,与作家常用习惯

有较大偏差,输出判断:真的概率未达到显著但不能断定一定是“伪”。并输出第二个结果,

“风吹云散”未在作家高频词表、高频简略句常用表中出现。“明月照人来”未在作家高频词表、高频简略句常用表中出现。

“风吹云散”与“明月照人来”合用,不是作家在该书(不同文本)习惯做法的概率高。

[例A3] 计算机判断《金骷髅》开头的“夜幕低垂,”不对仗(夜幕低垂,盈天的黄沙,淹没到马胫,),

与作家在该书的习惯文字运作习惯有偏差——有显著的不可忽略概率。

有了这些计算机程序,笔者作“真笔还原”就没有想象中困难。

[例D1]把“夜幕低垂,”改为 对仗方式。

笔者“干预式人机对话”,要求输出江南柳 对“夜”的描述。计算机输出

第01章出现9个“夜”,四字词为“大雪之夜”、“围炉夜话”等(排除“夜风”、“静夜”的2字词)

第02章出现8个“夜”,均不符合。。。

一直找,没有结果。

再输入与夜相关的“月”和“星”,最后计算机输出N个,其中2阶词距、加权2阶词距

符合要求的是“寒星寥落”,因此 笔者作“真笔还原”根据数学的显著概率,修改为

“夜幕低垂,寒星寥落。盈天的黄沙,淹没到马胫,”



半剑飘东半剑西 发表于 2022-11-2 07:55:48

本帖最后由 半剑飘东半剑西 于 2022-11-10 08:01 编辑

科技发展,日新月异;工具进化,斗转星移。不由令人时常感叹。

一个以前使用8吋计算机磁盘(以k为存储单位)的人,时常感叹现在硬盘居然以T为单位(中间经历k,M,G才到T)。

一个以前使用DOS、CCDOS磁盘操作系统的人,时常感叹现在微软操作系统已到拟人化的程度。

一个以前使用苹果微型机、TRS80进行BASIC语言编程的人,时常感叹现在C++语言为基础的混合编程功能之强大。

一个以前在计算机机房门口排队准备调试程序的人,时常感叹现在许多人家用阵列计算机已可进行拟并行化处理,使用GPU处理复杂图像。

一个见证过大时代的人,时常感叹现在许多武侠网站已关闭或链接警告,时常感叹邻居七八十岁武侠迷还在上网看李凉,
    时常感慨古武网前辈之多(未必都肯注册)令人叹为观止。


   为谁辛苦为谁忙?   我高兴,希望你也高兴。

   赠人玫瑰,手有余香;赠人佳作,甘之如饴!!!


半剑飘东半剑西 发表于 2022-11-3 13:56:21

本帖最后由 半剑飘东半剑西 于 2022-11-3 14:31 编辑

综合使用人工智能、仿真、消噪等技术的古籍识别和修改,

一个重要分支是知识发现,包括框架发现、题材发现....当然也可应用于

发现错误,只需调整一下参数。

例如,第一章

“他哪里想得到,日后断肠峡上,若不是这只金鹰,那里还有他的命在?”

   知识发现要标记“断肠峡”和“金鹰”,两个关键词的相关系数为1,为

防止遗漏,要作二级补充,“鹰”与“断肠峡”相关系数为0.8。

同时,人工智能高度检索全文,发现 “金鹰”与 “淡黄云影”相关系数高于0.75,

也认为“淡黄云影”与“断肠峡”相关度较高,(0.8*0.75=0.6>0.5),

把 “鹰”、“淡黄云影”作为“金鹰”的后备关键词。

半剑飘东半剑西 发表于 2022-11-3 13:56:55

本帖最后由 半剑飘东半剑西 于 2022-11-3 14:46 编辑

   启动程序,发现第2章到第17章,均未出现“断肠峡”,而出现“金鹰”、以至

“鹰”、“淡黄云影”的文字位置,调节区间检索,不断扩大区间范围,居然均未

出现“断肠峡”......(省去若干术语),人工智能子程序作出 疑似 有漏洞的判断。

   仔细检查,第09到第12章,写诸葛玉被金鹰所救,地方应就是“断肠峡”,原书

却一直未标出“断肠峡”。

   到了第18章出现多个“断肠峡”,在 “断肠峡”的文字位置,调节区间检索,不断扩大区间范围,

......(省去若干术语)输出多段文字,例如

“诸葛玉一闻“桃花”二字,就知十有九成必是指的桃花瀑,那断肠峡虽然没听说过,

但冷面华陀曾言,桃花瀑举世只有一处,想必就是鬼谷了!”

以及若干判断(省去术语)

      诸葛玉居然未 听说过 “断肠峡”,此 “断肠峡”非那“断肠峡”。

再调整参数,用人工智能处理 第18章出现多个“断肠峡”文字,输入一组“谓词逻辑”,

程序明确表示两个“断肠峡”虽然 相同用字—— “同词”,但带不同相关词组A,B。A与B 匹配度差。

其中输出的关联句子 例子为

“铁指丐与石惊天,恨不得一步赶到断肠峡,好用那秉天地间纯阳之气而生的桃花瀑,

治疗三弟所受‘蚀骨冰丝’之伤。”

“少侠不必心急,断肠峡与莫愁谷外,经令尊大人布下了奇门阵图,那一班武林人物

虽然都是绝顶高手,但却无人敢越雷池一步!”

   综合判断是 第一章 “他哪里想得到,日后断肠峡上,若不是这只金鹰,那里还有他的命在?”

这个“断肠峡”名称,后面 第18章 错用了。

真笔还原的工作,就是 如何消除这些错误,保持“全书同一性”。

半剑飘东半剑西 发表于 2022-11-3 14:59:11

本帖最后由 半剑飘东半剑西 于 2022-11-3 15:04 编辑

但修复 “断肠峡”名称,是否 必要?是否 多此一举呢?

非也。第20章 有一段

   一叶道长此话一出,醉鬼还能勉强压住心头一股怒火,穷神可就有点存不住气了,只见他怪眼一翻,哈哈狂笑道:

“一叶老道,你怎这般不讲情理,诸葛玉早已骨化身消,难道这还不够么?”

  “谁能保证当年断肠峡之事不会重演!”

  “哼哼!一叶老道,你如此咄咄逼人,真认为我怕你们么?”

  眼看二人愈说愈火,千面人魔东方绝哪肯放过这大好机会,当下阴阴一笑,故意劝道:

   “道长息怒,诸葛玉若想像当日断肠峡那样死里逃生,事情虽有可能,但却不是必然,

    道长何必因小失大,万一惹恼了他们两位……”

  话到此处诡异万分地一笑,立即住口不言。

    江南柳先生 没有忘记 第01章的构思,在此多处强调

   “当日断肠峡那样死里逃生”

    不作真笔还原,再读这里文字,就搞糊涂了。

半剑飘东半剑西 发表于 2022-11-4 09:28:16

当然计算机也不是万能的,某类古籍修复,完全只能依靠人工。

可以弥补计算机的不足,是增加开销。例如DIALOG系统、 THOMSON(汤姆逊)旗下系统,

就像陆小凤一样,往DIALOG子系统、 THOMSON子系统扔进两个元宝,然后可随便问

请问一个普通妇女,因假死在沙漠里被活埋,有没有可能生还?如果生还,会是哪些状况发生?

大智大通——系统可能要求你更改,变成 若干个关键词的查询 ,还要再学陆小凤扔进两个元宝。

得到一大批资料,可能都不是你需要的,但至少你可以清楚,大智大通说“有人生还过”。

半剑飘东半剑西 发表于 2022-11-4 09:55:59

本帖最后由 半剑飘东半剑西 于 2022-11-4 11:16 编辑

在周围没有电击设备,被埋了也无法使用医学救护(传统医统手段也可能有次级状态如体质弱者肋骨断,不符合小说要求)

一个假死的人如何苏醒?

医学鉴证告诉我们,对某类人而言,水是一种重要武器。

某些使用西语的地域,为了防恐保民,研究了各种没严重抵触法律而可以保护人民的“雷霆手段”
(某些西语机构经常认为香港搞笑电影 往胸口放黄页 的情节需要取消),一个重要发现是“水”。

对某类人、某种姿势例如倒仰 而言,水的合理运用,可以起到类似 电击救人时 过了临界的激烈反应(007之类电影)。

类比 在沙漠,激烈反应之强,足于 救人。

而水这种武器一直没有被让人类忘记。一个像“51区”一样,一直没被人承认的,

还有“雷管”——反击外星人计划。

工作原理 是 自行车打气筒,马路井盖,水煮沸腾,的叠加。

设想 1996年上映《独立日》反击外星人(又名《天煞 地球反击战》)

场面出现,天空出现 巨大的外星人 飞碟, 太平洋地某处突然打开地面,出现缺口,

超高速的水蒸气,把一个巨大的特殊材料制成的“原始武器”井盖,超高速飞向天空,撞向飞碟

由于武器太过原始,外星人的高科技阻止不了且是突然袭击

(相对运动等于飞碟撞向井盖),于是....


诚如愚友所言,主角母亲沙墓生还一节,成作者心病。钦佩江南柳者,总需有人堵漏以慰作者,

有第1篇查漏补缺的文章出现,以后便有第2篇 接力,再改进;...;第n篇, 公众认可。有与没有之间,是个鸿沟。





半剑飘东半剑西 发表于 2022-11-4 13:51:08

本帖最后由 半剑飘东半剑西 于 2022-11-4 13:53 编辑

   除了某类特殊文本,修复完全只能依靠人工之外,

文本的修复,有时规定得比原作者亲自修改、准备再版还要严格。

   必须使用原作者使用的高频字、高频词,造句习惯,语境等。

使用计算机辅助修复的,最后还必须对最终修复结果,再作一次程序检验,判断是否符合要求。

   超过阀值的,修复作废。

    道理如同 严重烧烧病人的皮肤修复,要用本人身上可取的最好的完整皮肤,且防止出现排斥。

    因此,如果 作品的 缺页达到10%以上,很可能没有修复必要。

   一般原则是,能不改就不改,能少改就不多改。改的地方要标出——以后争取更好的修改(计算机可判断)

如果以后找到丢失的缺页,则修复取消,予以替换。

    但如果一位作家的遣词造句特殊,文字驾驭与众不同,作品的精华保留在95%以上,那么

修复好的机会,也就大增。

半剑飘东半剑西 发表于 2022-11-5 07:58:04

本帖最后由 半剑飘东半剑西 于 2022-11-5 08:20 编辑

    数学在古籍修复的应用甚多,正是数学为人工智能打下扎实基础,例如神经网络理论。

有些是直接应用,例如采用多元插值函数,通过多元插值、多元数值逼近作修复,其好处是

通过插值、逼近理论可以直接估计出残差,残差在可控范围内,等于修复成功。

   多元不好理解,降维到一元。上世纪八十年代前的“特殊岁月”,

大数学家华罗庚在中华大地推广优选法,在中华大地的若干工厂实现工业生产(制造业)的

最优控制。一套不断推广的数学工具(适合当年无计算机的计算尺操作),

其实就是一元函数的插值逼近,结果以带有凸性等特性的非线性函数表示出。

为何能用于工业的最优控制?

因为凸性等结果可直接转换为最大、最小值......

页: 1 2 [3] 4
查看完整版本: 江南柳《金骷髅》原稿被误改及“恶搞”内容 考证