20230721晨课
现在我们对小说做文本分析,可以直接把文本倒进计算机,输入一些代码指令,让计算机来做分析。但是在上世纪八十年代,计算机在国内还没普及,只能手动来做统计。陈大康设了近80个检验指标,包括虚字、句长和作者习惯使用的专用词汇,等等。他把72万余字的《红楼梦》前前后后查检了上百遍,获得了约2万个数据。一番推演之后,破案了:这前八十回和后四十回,不是一个人写的。
统计分析呈现出的种种证据,细如发丝,却又“铁证如山”。比如,前八十回,作者喜欢用“越发”这个词,但后四十回,同样意思表达却用的是“更加”;前八十回一般用“才刚”这个词,而后四十回里却是用“刚才”;前八十回里,就连尊贵的王夫人或清雅的林黛玉也难免有时要说个“屁”字,后四十回的作者却似乎很不屑于使用“脏”字,在那二十多万字里只出现过两次。像这样的用词差异,陈大康发现了27种,而且每次有发现都要把《红楼梦》再查阅一遍来证实。
最后,他花了一年多的时间,得出结论:作品前八十回的语言风格完全一致,但是后四十回的语言风格有明显差异,应该不是出自曹雪芹之手。在第八十一回到第一百回之间,应该是含有少量的曹雪芹的残稿。不过运用数理语言学做统计分析,只能指出残稿的所在区间,不能确定具体哪段属于残稿。
晨课:陈大康-条分缕析、细致入微的“探案”视角。
共有 0 条评论