摘要
目的评价文本分析联合支持向量机(SVM)对肿瘤ICD-O-3病理形态学自动分类的准确性,为汉语环境的肿瘤分类编码研究提供参考。方法通过浙江省慢性病监测信息管理系统收集2017—2019年浙江省户籍居民肿瘤报告卡,根据ICD-O-3编码,对病理学文本提取关键词,采用SVM进行自动化分类;并与16名有2年以上肿瘤编码经验的专业技术人员分类结果比较,计算准确率、召回率及两者的调和平均数(F值)评估分类效果。结果纳入2017—2019年浙江省肿瘤报告卡83 082例,17个形态学分类,以腺癌、鳞状和移行细胞癌为主,52 877例占63.65%。通过文本分析筛选出1 090个关键词,准确率为77.20%,召回率为96.27%,F值为85.69。结论采用文本分析联合SVM可提高肿瘤ICD-O-3病理形态学自动分类效率,但准确性有待进一步提升。
-
单位浙江省疾病预防控制中心