摘要

[研究目的]自动识别出潜藏在非结构化南海维权学术全文本中的证据知识元,是完整、全面、多角度地重组织证据知识元并构建证据链、厘清我国南海维权历史过程的基础。[研究方法]根据证据的内涵及知识元语义描述模型理论,提出证据知识元的概念;分析证据知识元的描述需求,以结构化的形式定义了面向南海维权学术全文本的证据知识元表示模型,并在此基础上提出证据知识元自动识别方法;以南海维权证据知识元自动识别的实证研究验证了该方法的可行性。[研究结论]证据知识元表示模型在面向南海维权学术全文本时具有适用性,结合证据知识元识别规则与深度学习方法达到较好的自动识别效果,其中BERT模型和ERNIE模型表现最佳,在南海维权证据知识元自动识别的对比实验中,微观F1值分别达到了96.75%和96.64%,明显领先其他模型,可以满足南海维权证据知识元自动识别的要求。

全文