摘要
目的基于加权基因共表达网络分析(WGCNA)筛选卵巢上皮性癌(卵巢癌)预后相关关键基因, 并建立基因预后模型。方法 (1)从美国国家生物技术信息中心(NCBI)基因表达综合(GEO)数据库下载基因表达谱数据集GSE26712, 共有185份卵巢癌组织标本和10份正常卵巢组织标本的数据, 采用limma软件包筛选出卵巢癌的差异表达基因, 与WGCNA筛选出的卵巢癌预后相关模块基因绘制韦恩(Venn)图, 取其交集, 得到交集基因;再结合基因本体(GO)、京都基因和基因组百科全书(KEGG)进行信号通路富集分析, 构建交集基因相应蛋白之间的相互作用网络。(2)在交集基因中, 采用单因素及多因素Cox回归模型分析筛选出与卵巢癌患者总生存时间显著相关的关键基因, 据此构建基因预后模型, 预后模型风险评分为各关键基因的表达水平乘以相应权重值后求和, 以风险评分的中位数为界分为高风险组和低风险组。使用癌症基因组图谱(TCGA)数据库(共有379份卵巢癌组织标本)进行验证;并对TCGA数据库中的高风险组、低风险组采用基因集富集分析(GSEA)进行KEGG信号通路富集、基因突变分析和免疫特征分析。结果 (1)数据集GSE26712筛选出的1 024个卵巢癌差异表达基因与WGCNA筛选出的523个卵巢癌预后相关模块基因绘制韦恩图, 取其交集获得378个交集基因。(2)单因素及多因素Cox回归模型分析共筛选出6个与预后显著相关的关键基因, 即BNC1、CERK、FOXO1、GALNT6、MRPL2、PRSS2基因, 构建基因预后模型, 风险评分=BNC1基因表达水平×0.06+CERK基因表达水平×0.24+FOXO1基因表达水平×0.14+GALNT6基因表达水平×(-0.22)+MRPL2基因表达水平×(-0.20)+PRSS2基因表达水平×(-0.07)。训练集(GSE26712数据集)和验证集(TCGA数据库)中低风险组总生存率均显著高于高风险组(P<0.001, P=0.003)。采用GSEA进行的KEGG信号通路富集发现, 低风险组的基因在氧化磷酸化相关通路中富集, 高风险组的基因在恶性肿瘤、钙离子等信号通路中富集;基因突变分析发现, TP53和TTN基因在高风险组(分别为82%、23%)和低风险组(分别为85%、24%)中的突变率均高于15%;免疫特征分析发现, 低风险组浆细胞、滤泡辅助性T淋巴细胞、M1型巨噬细胞的浸润比例均显著高于高风险组(P均<0.05), 而休眠记忆CD4 T淋巴细胞的浸润比例显著低于高风险组(P<0.05)。结论基于WGCNA筛选的卵巢癌关键基因建立的基因预后模型能有效预测卵巢癌患者的预后, 基因预后模型中的6个关键基因为研究卵巢癌的发生、发展及治疗靶点提供了参考依据。
-
单位四川省肿瘤医院