采用Seq2Seq模型的非受限词义消歧方法

作者:唐善成; 马付玉; 张镤月; 陈熊熊
来源:西北大学学报(自然科学版), 2019, 49(03): 351-355.
DOI:10.16152/j.cnki.xdxbzr.2019-03-004

摘要

词义消歧在中文自然语言处理中有着重要作用,基于传统机器学习的方法存在准确度不高,需要人工提取文本特征的缺点;基于深度学习的方法不适于词义歧义较多的情况。该文提出采用Seq2Seq模型的非受限词义消歧方法,输入词上下文序列,经过编码器编码得到潜在语义向量,再经过解码器解码输出词义序列,适用于所有词义歧义情况。最后,在SemEval-2007 Task#5任务中进行测试,测试结果表明,该文提出的方法比其他7种方法中的最优方法消歧准确率提高了11.48%。

全文