摘要

【目的】将实体信息与预训练语言模型结合应用到古汉语关系分类任务中,构建古汉语关系分类模型。【方法】首先在预训练模型输入层中使用特殊token标记出实体对的位置,同时在原关系句之后拼接实体类型描述句;其次在预练语言模型的输出中进一步提取实体语义信息;然后通过CNN将token相对于首尾实体的位置信息融入模型中;最后将关系句表示、实体语义表示以及CNN输出拼接经过分类器得到关系标签。【结果】相较于仅使用预训练语言模型,本文的方法在微平均F1上平均有3.5%的提升。【局限】通过分析混淆矩阵发现本文的模型在具有相同实体类型组合的关系类型上容易出现预测错误。【结论】在预训练语言模型中结合实体信息能够提高古汉语关系分类的效果,且实验结果证明本文融合实体信息的方法相对有效。