一种具有多种子模块信息的中文词向量生成方法

作者:朱鹏; 程大伟; 杨芳洲; 罗轶凤; 钱卫宁; 周傲英
来源:2019-11-26, 中国, ZL201911172979.X.

摘要

本发明提出了一种具有多种子模块信息的中文词向量生成方法,其特点是采用包括单词、字符、部首、成分、字形和拼音的六种子模块信息与注意力机制融合方法,以学习改进的汉字嵌入表示形式,将其融合到具有适当权重的词嵌入中,生成高精度的词向量。本发明与现有技术相比具有根据注意机制为每种子模块信息分配适当的权重,以减少语义含义较少的子模块的权重,提高子模块的权重,具有更丰富语义含义的模块,改善了中文单词嵌入,实现了可观的性能提升。