数字人文视域下秦汉简牍文本挖掘研究——以里耶秦简牍(一、二卷)为例

作者:**; 冯慧敏; 刘铭; 张鹏雷; 唐杰; 陈镱文
来源:渭南师范学院学报, 2022, 37(06): 86-93.
DOI:10.15924/j.cnki.1009-5128.2022.06.009

摘要

近年来出土的秦简牍材料,为研究战国晚期至秦代的历史提供了丰富而可靠的资源。文章以目前已经校读出版的里耶秦简一、二卷为语料来源,通过特征词提取、词频统计、文本摘要及主题模型等文本挖掘技术,从词频、事件、主题三个维度对简牍内容进行挖掘与分析。实验表明,一、二卷中主要为官府文书,内容涉及文书邮传、债务、粮食、徒簿、案件、刑徒管理等内容,能够较好地反映里耶一、二卷的大体内容,并且与校释第一卷中给出的主题内容大体一致。为简牍材料的研究提供了新思路,证实了可借助文本挖掘方法来理解、诠释中国丰富的文化遗产。

全文