摘要

预测患者未来的健康状态具有重要社会意义和科学价值。医疗大数据的积累为通过数据挖掘和分析来获得预测模型,或建立预测方法提供新的基础。患者相似性分析基于普适的患者间距离评估,从大量临床实践数据中获取疾病发展的普遍规律,从而为使用通用的计算机辅助临床决策支持框架、达到个性化诊疗提供了可能。目前该技术已在癌症、内分泌疾病、心脏疾病等大量领域得到初步的验证,并成为医学人工智能技术向临床转化最重要的一个方向。首先综述患者相似性分析的理论基础和研究进展,详细阐述患者相似性分析的一般性计算框架,讨论其中所涉及的大量关键技术,如数据预处理、降维、计算概念间距离和构建相似组等,以期为国内同行提供关于该领域研究的最新进展。同时指出目前患者相似性的研究还存在问题和挑战,为国内开展相关研究提供参考。