基于社交媒体的药物不良反应检测

作者:朱晓旭; 林鸿飞*; 曾泽渊
来源:山西大学学报(自然科学版), 2020, 43(01): 14-21.
DOI:10.13451/j.sxu.ns.2019121

摘要

随着互联网的飞速发展,人们都在用社交媒体来作为知识分享、传播以及情感交流的主要平台,因此在社交媒体的药物不良反应检测将会是关注当前人们用药情况的重要渠道。与此同时,传统的机器学习在构建特征时较为困难并且有着较弱的迁移性,而卷积神经网络,即CNN,在进行空间信息建模时又存在效率低和空间不敏感的缺点。针对以上问题,文章基于通用文本处理特征和生物医学的专属特征等,提出一种基于胶囊网络和长短时记忆神经网络结合的方法来检测在社交媒体中的药物不良反应事件,使用的语料集是2017年The Social Media Mining for Health (SMM4H)共享任务语料集中的数据,对语料进行预处理后对药物不良反应进行标记,并且构造了分布式词向量特征、词性标记、字符级向量特征以及每句话中药物名和情感词作为模型的特征输入,形成对比实验。解决了在分类过程中特征之间空间关系缺失和构建模型效率低的问题,该实验结果与此前先进的结果相比F1值升高了4.2%,证明该方法在检测社交媒体的药物不良反应事件中是有效的并且具有良好的性能。