人工智能模拟辞例归纳的初步测试

作者:莫伯峰; 邱炜琦; 谢泽澄
来源:汉语言文学研究, 2021, 12(03): 128-135.
DOI:10.3969/j.issn.1674-8506.2021.03.020

摘要

古文字考释中的辞例归纳法,其实是综合了经验和理性两个方面共同作用的一种词义推定方法。人工智能语言模型现在主要模拟了人类经验主义的方法,并在日常语言处理方面取得了比较好的效果。如果将此类模型运用于古文字领域来模拟辞例归纳,也定会有所助益。我们基于Bert模型,用《四库全书》作为特定语料对模型进行了训练。以《上博简》(1-9)中2103个字为测试对象,模拟专家的部分辞例归纳能力,预测被遮蔽起来的文字。在总数23157的备选字符中,前300预测正确率达到59%,前100预测正确率达到46%,前50预测正确率达到38%,前10预测正确率达到25%,前5预测正确率达到20%。可见,人工智能在古文字领域也具有类似人脑凭借语言经验进行辞例归纳的能力。同时,结果也提示,必须结合理性主义方法,才能实现完整的辞例归纳能力,建立相关的知识库必不可少。

全文