一种基于注意力机制的电子病历中药物词向量转化方法

作者:王青华; 邵劲松; 张远鹏; 姜磊; 白鹤鸣; 黄勋; 徐沪济; 王理*
来源:第二军医大学学报, 2020, 41(10): 1129-1135.
DOI:10.16781/j.0258-879x.2020.10.1129

摘要

目的提出一种基于注意力机制的药物词向量生成模型Drug2vec,对药物信息做向量化表示,并与Word2vec和Med2vec模型比较向量转化效果。方法使用注意力机制捕获医疗实体对中心词的作用,提出Drug2vec模型,将非结构化电子病历中的医疗实体转化为向量。使用包含14 219例系统性红斑狼疮(SLE)患者和963个药物实体的数据集测试Drug2vec模型生成词向量的效果,并且与广泛应用的语言概念空间向量转化模型Word2vec和Med2vec进行对比。结果在SLE患者数据集中,Drug2vec模型产生的药物词向量准确度优于Word2vec和Med2vec模型。药物词向量相似度排序结果显示Drug2vec模型产生的向量结果符合临床医师的用药顺序。结论 Drug2vec模型可以更精确地利用周围实体修正中心药物实体,从而产生更准确的药物向量。

全文