20230721晨课

ht • 2023-07-21 21:26 • 杂文

现在我们对小说做文本分析，可以直接把文本倒进计算机，输入一些代码指令，让计算机来做分析。但是在上世纪八十年代，计算机在国内还没普及，只能手动来做统计。陈大康设了近80个检验指标，包括虚字、句长和作者习惯使用的专用词汇，等等。他把72万余字的《红楼梦》前前后后查检了上百遍，获得了约2万个数据。一番推演之后，破案了：这前八十回和后四十回，不是一个人写的。

统计分析呈现出的种种证据，细如发丝，却又“铁证如山”。比如，前八十回，作者喜欢用“越发”这个词，但后四十回，同样意思表达却用的是“更加”；前八十回一般用“才刚”这个词，而后四十回里却是用“刚才”；前八十回里，就连尊贵的王夫人或清雅的林黛玉也难免有时要说个“屁”字，后四十回的作者却似乎很不屑于使用“脏”字，在那二十多万字里只出现过两次。像这样的用词差异，陈大康发现了27种，而且每次有发现都要把《红楼梦》再查阅一遍来证实。

最后，他花了一年多的时间，得出结论：作品前八十回的语言风格完全一致，但是后四十回的语言风格有明显差异，应该不是出自曹雪芹之手。在第八十一回到第一百回之间，应该是含有少量的曹雪芹的残稿。不过运用数理语言学做统计分析，只能指出残稿的所在区间，不能确定具体哪段属于残稿。

晨课：陈大康-条分缕析、细致入微的“探案”视角。

版权声明：
作者：ht
链接：https://www.techfm.club/p/61450.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

代码语言

二维码

评论花絮

< <上一篇

真正的智慧，是做到这三件事

下一篇>>

搜索内容

20230721晨课

取消回复

共有 0 条评论

Ads