摘要

本发明公开了一种基于ELMo嵌入与门控自注意力机制的阅读理解方法,基于涉及ELMo嵌入与门控自注意力函数的模型,该方法同时使用了ELMo表示、单词的字符表示、glove词表示的多维融合表示,并在双向注意网络后引入了带有门控函数的自注意力层,以提取长上下文问信息,并进一步过滤信息。此外,在回答层该方法将各层所得特征表示复用,并使用双线性函数进行最终答案的位置预测,进一步提高了系统的整体性能。在SQuAD数据集上的实验中,证明了该模型大幅优于许多基线模型,性能较其原始基线提升了5个百分点左右,且其性能接近人类测试的平均水平,充分证明了该方法的有效性。