摘要
目的 探讨区块森林模型结合正则化降维方法在癌症多组学数据中的预后预测效果。方法 通过模拟数据与实际肺腺癌多组学数据,使用自适应弹性网正则化方法对数据进行降维,降维后对比区块森林模型与随机生存森林模型预后预测的不同,采用C指数作为两种模型泛化能力的评价指标。结果 模拟实验表明,在不同的模拟条件下,区块森林模型预测准确度均高于随机生存森林模型,且结合正则化方法后可改善模型过拟合。实例分析显示结合正则化的区块森林模型测试集平均C指数为0.890±0.021高于随机生存森林模型,预测结果差异具有统计学意义(P<0.001)。结论 区块森林模型通过引入“块选择”的随机过程,结合正则化进行降维,能够更好地适应多组学数据的复杂结构,提高预测性能。
-
单位山西医科大学; 中国医学科学院血液病医院