摘要
目的运用自然语言处理对证素辨证学(SESD)核心内容进行文本挖掘与可视化展示。方法第一步,基于Python语言搭建文本挖掘与分析环境,以SESD的核心章节为基础,建立SESD语料库;第二步,对语料库进行数字化处理,主要步骤包括分词、信息清理与合并、文档-词条矩阵、相关词典编译和信息转换;第三步,通过词云、关键词提取和可视化等手段挖掘和展示SESD语料库的内在信息。结果自然语言处理(NLP)可以促进计算机对SESD的识别和理解,SESD不同章节的关键词和权重不同。虚性证素是SESD的重要组成部分,如"气虚""阳虚""阴虚",重要的实性证素包括"血瘀""气滞"等,各核心证素间的关系密切。结论辨证论治是SESD的核心,利用NLP挖掘SESD有助于揭示证素之间的内在联系,为人工智能学习SESD提供依据。
- 单位