摘要
【目的】针对自然语言中普遍存在的隐喻现象,提出一种基于词向量融合和循环神经网络(RNN)的中英文隐喻识别方法。【方法】通过本文提出的词嵌入融合算法将文本映射到词向量空间作为神经网络的输入,以RNN作为编码器,注意力机制和池化技术作为特征提取器,最后利用Softmax计算文本为隐喻的概率。【结果】基于词嵌入融合的隐喻识别方法的准确率和F1值比基于普通词嵌入的方法在英文隐喻识别任务上可以提高11.8%和6.3%,在中文隐喻识别任务上可以提高8.9%和7.8%。【局限】由于长距离依存问题,本文方法在句式复杂的长文本上隐喻识别效果不稳定。【结论】基于词嵌入融合和RNN的模型在隐喻识别问题上表现非常好,说明词嵌入融合可以提高神经网络对隐喻的识别能力。
- 单位