摘要

随着互联网、大数据的飞速发展,以深度神经网络DNN为代表的人工智能技术迎来了黄金发展时期,自动问答作为人工智能领域的一个重要分支,也得到越来越多学者们的关注。现有网络模型可以提取问题或答案的语义特征,但一方面忽略了问题与答案之间的语义联系,另一方面也不能从整体上把握问题或答案内部所有字符之间的潜在联系。因此分别提出两种不同形式的注意力交互模块,即互注意力交互模块和自注意力交互模块,用于解决上述问题,并设计出一套基于所提注意力交互模块的深度学习模型用于证明该注意力交互模块的有效性。首先将问题和答案中的每个字符映射成固定长度的向量,分别得到问题和答案对应的字嵌入矩阵;后将字嵌入矩阵送入注意力交互模块,得到综合考虑问题与答案所有字符之后的字嵌入矩阵,并与之前的字嵌入矩阵相加之后送入深度神经网络模块,用于提取问题与答案的语义特征;最后得到问题与答案的向量表示并计算两者之间的相似度。实验表明,所提模型的Top-1准确度较主流深度学习模型提高最高3.55个百分点,证明了所提注意力交互模块对于改善上述问题的有效性。