摘要

目的对胰腺癌22种免疫细胞浸润占比进行分析,探讨利用机器学习算法,构建预后二分类模型对胰腺癌患者生存期评价的可行性。方法从TCGA数据库,下载胰腺癌患者的转录组数据和相关的临床数据。通过"CIBERSORT"算法得到入组胰腺癌患者22种免疫细胞浸润占比特征。利用生物信息学方法对免疫细胞浸润占比特征进行筛选,构建预后模型。以受试者工作特征曲线下面积(AUC)、准确度、灵敏度、特异度、阳值预测值和阴值预测值作为预后二分类模型优劣的考核指标。行免疫细胞相关性分析及免疫功能分析,进一步阐述预后二分类模型的可信度与胰腺癌中的免疫景观。结果从22种免疫细胞中筛选出Macrophages M1、T cells CD8、B cells na6ve 3种免疫细胞浸润占比特征作为胰腺癌患者生存是否超过1年二分类预后模型的构建因子。采用9种机器学习分类模型算法构建二分类初始模型。按AUC排序,在训练集中表现最佳者为Extreme gradient boost (XGB)算法,在训练集中表现最佳者为Random Forest(RF)算法。RF稳定性相对较好,最终选取RF算法构建模型,具有较高的精准度。基于危险评分的免疫细胞相关性分析中,B cells na6ve和T cells CD8在低危组中免疫浸润高于高危组(P<0.001),Macrophages M1在高危组中免疫浸润高于低危组(P<0.001);与模型构建因子有关的免疫功能分析中,APCcoinhibition、MHCclassⅠ、TypeⅠIFNReponse在高危组中免疫浸润评分高于低危组(P<0.05);在免疫浸润分型分析中,C1, C2, C3, C6在高、低危组中显示出差异性(P<0.05)。结论基于机器学习构建的胰腺癌患者预后二分类模型,能较准确地评估胰腺癌患者生存是否超过1年,为临床对胰腺癌患者进行个体化治疗提供参考。

全文