摘要

【目的】为提高医药实体识别的效果、实现医药新知识的挖掘和提高医药科技论文的利用率,提出一种新的实体识别模型。【方法】构建基于Attention-BiLSTM-CRF的医药实体识别模型,在公开数据集GENIA Term Annotation Task和BioCreative Ⅱ Gene Mention Tagging上分别对模型进行测试,进而使用该模型对生物医药论文的摘要进行实体标注。【结果】本文提出的模型优于其他基准模型,在两个数据集上的F1值分别为81.57%和84.23%、准确率分别为92.51%和97.85%,并且在数据不平衡的情况下更有优势。【局限】实体标注实验数据量和应用范围较为单一。【结论】基于Attention-BiLSTM-CRF的医药实体识别模型可以提高实体识别效果并实现医药新知识的挖掘。

推荐论文
更多