文本分析联合支持向量机的肿瘤ICD-O-3病理形态学自动分类效果评价

作者:潘劲; 龚巍巍; 费方荣; 王蒙; 周晓燕; 胡如英; 钟节鸣*
来源:预防医学, 2021, 33(03): 255-263.
DOI:10.19485/j.cnki.issn2096-5087.2021.03.009

摘要

目的评价文本分析联合支持向量机(SVM)对肿瘤ICD-O-3病理形态学自动分类的准确性,为汉语环境的肿瘤分类编码研究提供参考。方法通过浙江省慢性病监测信息管理系统收集2017—2019年浙江省户籍居民肿瘤报告卡,根据ICD-O-3编码,对病理学文本提取关键词,采用SVM进行自动化分类;并与16名有2年以上肿瘤编码经验的专业技术人员分类结果比较,计算准确率、召回率及两者的调和平均数(F值)评估分类效果。结果纳入2017—2019年浙江省肿瘤报告卡83 082例,17个形态学分类,以腺癌、鳞状和移行细胞癌为主,52 877例占63.65%。通过文本分析筛选出1 090个关键词,准确率为77.20%,召回率为96.27%,F值为85.69。结论采用文本分析联合SVM可提高肿瘤ICD-O-3病理形态学自动分类效率,但准确性有待进一步提升。

  • 单位
    浙江省疾病预防控制中心

全文