摘要

目的从中医临床医案抽取症状命名实体。方法对名老中医临床肺癌医案进行序列标记,利用条件随机场对标注样本进行学习,采取十折交叉验证对模型进行测试,使用多分类评价指标对模型结果进行评价。结果 CRF模型微平均的三个评价指标(P,R,F1)为(0.9233±0.0063,0.9222±0.0062,0.9211±0.0062);宏平均评价指标为(0.8822±0.0126,0.8322±0.0215,0.8556±0.0151)。病位权重由高到低依次为"背""、胸""、口""、腰""、鼻"等词;症状权重由高到低依次为"咳""、痛""、痰""、酸""、闷"等词。结论利用条件随机场构建中医临床信息抽取模型,抽取结果符合中医辨证理论,能够有效实现中医临床医案症状命名实体识别。