摘要
如今英文实体类型识别技术得到快速发展,但中文文本整体结构较为复杂,经常存在多义现象,同一个词在不同的句、不同的位置有不同的含义,这为中文实体类型识别技术的研究发展造成严重阻碍。同时,目前常用的实体类型识别模型解码层主要使用机器学习算法,但算法整体提取精度和维特比算法执行效率较低,难以满足当前需求。基于以上中文实体类型识别难点,基于中文语言特性,提出基于深度学习的中文实体类型边界识别模型。此模型主要采用基于多元卷积解码与二分类模型训练方法,实现所有输入通过自注意力进行提取,可有效提高模型训练的针对性,解决中文实体类型边界识别中词语歧义等问题。
- 单位