摘要

目的 利用癌症基因图谱(TCGA)数据库建立口底鳞状细胞癌(简称口底鳞癌)患者预后的长链非编码RNA(lncRNA)风险预测模型。方法 下载TCGA数据库中口底鳞癌及对应癌旁组织的基因表达谱数据及临床相关数据,在R软件中通过edgeR包对口底鳞癌组织与癌旁组织中的基因表达数据进行分析,筛选差异表达lncRNA;采用单变量和多变量Cox风险回归模型筛选和建立lncRNA风险预测模型;绘制风险评分曲线、患者生存状态散点图、lncRNA表达热图、Kaplan-Meier生存曲线及受试者工作特征(ROC)曲线以评估风险模型与口底鳞癌患者预后的相关性。结果 从TCGA数据库中得到54例口底鳞癌组织和3例对应癌旁组织的基因表达数据,使用R软件edgeR包进行差异基因分析(筛选标准:P≤0.001,倍数变化≥2)得到差异lncRNA 138个。单变量Cox回归分析及多变量Cox回归分析得到基于3个lncRNA(MIR1-1HG、HOXC13-AS、RAMP2-AS1)的多变量风险预测模型,一致性系数为0.77。患者风险评分、生存状态散点图显示,风险评分越高口底鳞癌患者的死亡率越高。Kaplan-Meier生存曲线显示,高风险口底鳞癌患者的总生存率低于低风险口底鳞癌患者(P<0.001)。模型的ROC曲线下面积为0.895。结论 本研究筛选出3个具有临床意义的lncRNA,为口底鳞癌基础研究提供有价值的生物标志物;基于MIR1-1HG、HOXC13-AS、RAMP2-AS1的风险预测模型可有效预测口底鳞癌患者的预后,有望用于指导临床治疗。