摘要
针对短文本问句实体消歧中缺少实体描述信息和使用缩略词导致无法召回目标实体的问题,提出了一种融合多特征和由粗到精排序模型的短文本问句实体消歧方法。首先,使用N-Gram分词模型辅助召回候选实体,然后选取候选实体在知识图谱中的关系和相邻实体,分别计算与问句的相似度,作为实体在知识图谱中的描述信息,结合实体重要性等多个特征进行特征拟合;最后,通过粗排模型减少候选实体集合的数量,再经过精排模型排序得到最终的目标实体。在CCKS2019-CKBQA的数据集上的实体消歧实验表明,本文模型的准确率达到91.35%。
- 单位