摘要
该研究利用Python语言设计程序,对《红楼梦》程乙本和前脂后程本的内容进行无干预的遍历搜索,一次性创建1-6个字符长度的词典;将两个版本的120回分别分为前、中、后三部分,利用单因子方差分析和杜凯氏方法验证,分别统计出每个版本中三部分之间分布频度具有显著性差异的1-6个字符长度的字词,并做出每个字词在每回中出现次数与回数的关系图,得到了一套能够将前、中、后40回的差异直观而全面地呈现出来的数据库,并对其中一些字词进行了分析。结果显示:程乙本和前脂后程本前80与后40回的差异,比前40与中40回的差异更为显著;前40与中40回为同一作者,前80与后40回不是同一作者。