摘要
医疗健康知识挖掘在人工智能和大数据时代受到了学界的极大关注,目前已经成为信息抽取和文本挖掘中的重要研究方向。在基于深度学习的实体识别、实体关系抽取、问答系统以及知识图谱构建研究中,各类语义资源、数据集和工具已经成为开展医疗健康知识挖掘的重要保障。该文首先对医疗健康知识挖掘中需要使用的UMLS、MeSH和SNOMED CT等语义资源进行了系统梳理,并详细分析了各类语义资源的实际应用场景,指出了中文语义资源存在的问题和不足;其次对英文和中文的电子病历、医学文献和在线健康数据集进行了重点论述,并对数据集的应用任务进行了分析;最后论述了常见的医疗健康文本处理工具和系统,并就其具体应用进行了讨论。该文为国内更好地开展医疗健康知识挖掘提供了参考。
- 单位