摘要
目的 通过生物信息学方法探索影响Ⅳ期结直肠癌(colorectal cancer,CRC)患者淋巴结转移相关的核心基因,为进一步对转移相关的潜在机制的探索提供线索。方法 本研究通过对GEO数据库进行检索,选择GSE63596的表达谱芯片进行后续研究。采用Agilent微阵列技术对所有15例患者的mRNA谱进行分析。差异分析采用LIMMA包进行运算,统计学过滤条件为:|Log2FC|>2,P <0.05。采用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)方法筛选出与CRC淋巴结转移相关的靶基因并构建预测模型。软件包glmnet,整合生存时间、生存状态和基因表达数据,利用LASSO回归分析,以获得最优模型。结果 通过对GSE63596的表达谱芯片差异分析,提示有501个基因在淋巴结阳性的肿瘤中表达上调,另外有102个基因表达下调。通过R语言软件中cutree Dynamic和module Eigengenes函数绘制聚类图,去除相似模块的影响,共得到15个模块,结果发现淋巴结阳性与drakgrey模块显著相关(cor=0.64,P=0.01),构建PPI网络后刷选出8个Hub基因。利用LASSO回归分析,以获得最优模型。设置Lambda值为0.0407,构建的模型公式为Riskscore=(0.1454)*DGAT1+(-0.0684)*GDPD3+(0.1404)*PDZK1IP1+(-0.1724)*PLA2G10。结论 筛选出与CRC转移相关的4个基因,可为CRC发生、转移和治疗的研究提供参考。
- 单位