摘要

<正>精准医学需要从医疗大数据中提取特征信息,将患者按不同的生物学亚群分类。自然语言处理技术的进步使自动化处理海量的原始超声文本数据成为可能。文中对国内外医疗文本数据自然语言处理的研究现状、面临的挑战、常用的处理方法及重要而未解决的问题进行阐述。从分析医疗大数据的特点出发,强调医疗大数据研究时数据质量控制的重要性,针对已有的文本数据污染现象,提出对原始超声文本数据的质量要求。

  • 单位
    四川大学华西医院

全文