基于词向量的化学领域知识发现初步研究

作者:王鑫; 吉久明; 李楠; 孙济庆
来源:图书馆杂志, 2018, 37(11): 90-98.
DOI:10.13663/j.cnki.lj.2018.11.013

摘要

在文本数据中,知识的表示具有抽象性、非结构化[1]、潜在性等特点,通过共现[2]、规则[3]和关联[4]等数据挖掘方式很难在体现词的语义性和句子的语法性下进行知识发现工作。本文在Word2Vec的基础上提出添加词属性的WP-Word2Vec模型,并依据词向量设计知识发现模型。通过实验表明WP-Word2Vec模型在训练词向量时能够融入词类别信息,在相应的相似词发现中相似度有所提高。

全文