摘要

本文收集了《蝶恋花(庭院深深深几许)》等六首作者存在争议的作品所涉及作者的其他作品作为训练语料,经过分词和特征提取后,使用朴素贝叶斯分类器学习作者特征,随后对争议作品进行作者判断。判断结果详细显示了各首争议作品的作者可能性,除《生查子·元夕》外,其余判断结果与文献考证的契合度较高。本文还收集了三组唐朝并称诗人——“元白“”皮陆“”小李杜”的作品,使用朴素贝叶斯分类器进行作者判断,取得了较好的效果,进一步验证了该方法在作者检测上的有效性。

全文