摘要

为了解决中医症状描述词的异名同义、一对多的问题,提出了一种基于预训练语言模型的2阶段症状标准化框架:第1阶段,生成候选标准症状词,参考中医症状词的定义与分类,利用多标签分类思想对原始症状词进行语义划分,进而得到相应语义标签下的候选标准症状词;第2阶段,对候选标准症状词进行排序,使用匹配模型对第1阶段得到的候选标准症状词集进行评分与排序,同时用策略对结果进行二次召回以提高症状标准化框架的性能,由此得到最终的标准化结果。实验结果表明,提出的症状标准化方法与传统方法相比能够更有效地处理症状标准化的问题。通过对比分析不同预训练语言模型在症状标准化任务上的性能,进一步说明了所提框架和策略的有效性。

全文