摘要
目的提出一种基于注意力机制的药物词向量生成模型Drug2vec,对药物信息做向量化表示,并与Word2vec和Med2vec模型比较向量转化效果。方法使用注意力机制捕获医疗实体对中心词的作用,提出Drug2vec模型,将非结构化电子病历中的医疗实体转化为向量。使用包含14 219例系统性红斑狼疮(SLE)患者和963个药物实体的数据集测试Drug2vec模型生成词向量的效果,并且与广泛应用的语言概念空间向量转化模型Word2vec和Med2vec进行对比。结果在SLE患者数据集中,Drug2vec模型产生的药物词向量准确度优于Word2vec和Med2vec模型。药物词向量相似度排序结果显示Drug2vec模型产生的向量结果符合临床医师的用药顺序。结论 Drug2vec模型可以更精确地利用周围实体修正中心药物实体,从而产生更准确的药物向量。
- 单位