摘要

基于《红楼梦》文本,统计120回每一章回的单字字频数据形成字频向量作为每一回的特征向量,并推算它们之间的余弦相似系数,进而推算前80回之间、后40回之间、以及前80回与后40回交叉的相似系数平均水平,并分别用t检验与Wilcoxon秩和检验两种假设检验方法,考察三者之间差异的显著性水平,结果表明,如果认可前80回为曹雪芹一人所著,那么更有理由认为后40回也出自一人之手;前80回与后40回来自两位不同的著者,同时不排除前80回有后人增补的痕迹,后40回有曹雪芹遗留的残稿,差异均具有极其显著性水平。

全文