摘要
基于数据挖掘的中医药临床研究可归纳为对"症-证-方-药"四要素之间关系或四要素与疗效、预后之间关系的研究。传统机器学习算法包含分类算法、聚类算法、关联规则、回归分析及多标记学习算法。总体而言,分类算法(如树模型、人工神经网络、支持向量机、贝叶斯网络)适合做"症-证"的证型判别研究和疗效、预后等结局的预测。关联规则算法适合中药配伍及"方-证"规律研究。聚类算法适用于体质、脉象的类别划分及类方鉴别的"方-药"研究。回归分析多用于疾病危险因素筛选及建立预测模型。而新型深度学习算法(如卷积神经网络模型、自动编码器、循环神经网络、深度置信网络算法等)适用于患病风险评估、用药推荐等特征提取困难并且定义和量化模糊的问题,其凭借无需人工构造特征的特性,具有更为重要的研究价值。通过对传统机器学习算法与深度学习算法的比较,提出中医药数据挖掘临床研究应守正创新,守住"中医思维方式",保持中医药理法方药的完整性,在此基础上进行创新,将多种算法相结合,从临床中来到临床中去。
-
单位山东中医药大学附属医院