摘要
针对癌症个体之间明显的异质性,本研究提出一种个体特异的差异甲基化基因识别方法并构建乳腺癌预后模型,在个体水平分析乳腺癌的发生发展。基于TCGA数据库中的乳腺癌甲基化数据,利用差异分析法和Grubbs离群值检测法识别个体特异的差异甲基化基因,通过基因富集分析得到12条与乳腺癌相关的生物通路。利用Cox回归模型和Lasso回归模型,筛选出47个和乳腺癌生存预后显著相关的预后基因。基于基因甲基化值构建乳腺癌生存预后模型,对乳腺癌患者进行生存预后分析。结果显示,构建的生存预后模型能成功区分乳腺癌患者的高风险组和低风险组。研究结果表明,本研究方法不仅能鉴定出乳腺癌共有的异常甲基化基因,同时能够识别出个体特异的差异甲基化基因;构建的生存预后模型可以稳健地预测乳腺癌患者的生存预后状态,有利于从个体基因甲基化的层面更好地理解乳腺癌的发生发展机制,促进精准医疗的发展。
- 单位