摘要

生存分析旨在预测某个感兴趣事件发生前的延续等待时间,已广泛应用于临床治疗中患者的生存状态分析.然而,受限于研究代价高昂和环境因素的影响,现有的生存分析方法不可避免地面临着高维小样本挑战以及复杂环境所引起的噪声敏感等问题.为了克服上述缺陷,本文提出一类噪声容错弱监督直推式矩阵补全(Weakly supervised transductive matrix completion, WSTMC)生存分析方法.该方法首先将生存分析问题建模为多任务直推式矩阵补全模型,然后引入高斯混合分布拟合真实数据中的复杂噪声以减轻模型的噪声敏感性,同时设计了一类多任务直推式特征选择机制来缓解高维小样本所带来的过拟合缺陷.此外,设计了一类有效的拟期望最大化优化算法用于求解所提出的WSTMC模型.最后, 5个微阵列基因表达数据集上的实验结果证实了所提出的WSTMC模型优于当前广泛使用的18种生存分析方法.

全文