摘要
数字人文作为一门交叉学科,其强调计算技术与人文学科融合发展。古汉语典籍是人文学科研究中重要的一部分,在此背景下,利用计算机技术对数字化后的《春秋经传》典籍进行关键词抽取探究,从而分析春秋经传的关键词分布情况。本文利用了三种关键词抽取算法,分别是基于无监督的TextRank算法、经典传统TF-IDF算法和LDA主题模型算法。基于Pooling的评价方法发现TextRank算法抽取的关键词结果更好,准确率达到84%。传统的TF-IDF算法和LDA主题模型算法准确率分别为62%和74%。同时,根据所抽取的关键词,可以发现春秋经传的记事内容主要围绕在诸侯国之间的聘问、会盟、征伐、婚丧、篡弑等。
- 单位