摘要
针对简单问题的知识库问答中实体识别和关系检测这两个组件相互独立,且忽略了实体与关系之间的对应关系的问题,提出一种联合实体识别和关系预测的神经网络模型。采用CNN-BiLSTM-CRF识别问句中的实体,将CNN-BiLSTM提取的文本特征与问题的标签嵌入特征组合后进行关系预测,提高实体识别的F1值和关系预测的准确率。模型能够同时检测问题中的实体和关系,提高了训练的效率。为快速将问题中的主题实体链接到知识库中,采用n-grams模型与TF-IDF的相结合构建实体别名索引,建立路径索引进行答案的查找。在流行的SimpleQuestions数据集上分析并验证了所提方法的有效性。
- 单位