摘要
【目的】针对对话问句长度较短、特征稀疏等特点,多方面分层级地提取问题文本的特征,更好地理解问句含义,提升分类效果。【方法】为丰富问题文本的语义表示,充分考虑问句中的疑问词、词性、词语位置特征,在词语级基于多特征注意力机制得到多通道特征矩阵;然后利用卷积神经网络对多通道特征矩阵进行深层次短语级特征提取,并将短语级特征融合后输入双向门控循环单元(GRU)获得前后向的上下文信息;最后,为强化前后向上下文特征中的主题信息,使用潜在主题注意力得到双向文本特征,并将双向特征融合得到最终的文本向量,输入Softmax得到分类结果。【结果】本文提出的层级注意力多通道卷积双向GRU模型在三个中文问题数据集上准确率分别达到93.89%、94.47%、94.23%,比LSTM模型、CNN模型分别最高提升5.82%和4.50%。【局限】仅使用三个中文问题语料进行验证。【结论】本文模型能够更加全面深层次地挖掘问题文本语义特征,弥补问句意图理解不准确的不足,提高了问题分类性能。
- 单位