摘要

目的 筛选与预后有关的程序性细胞死亡(programmed cell death,PCD)相关的长链非编码RNA(long non-coding RNA,lncRNA)并以此构建肝细胞癌(hepatocellular carcinoma,HCC)的预后风险评估列线图。方法 将从癌症基因组图谱中选择的HCC患者按1∶1随机抽样分为训练集和验证集。采用Pearson相关性分析筛选PCD相关lncRNAs,再用单因素Cox比例风险回归(简称“Cox回归”)模型分析筛选与训练集中的总生存时间有关的PCD相关lncRNAs,然后进一步采用多因素Cox回归模型分析影响HCC患者的预后风险因素,并建立判断HCC患者的风险评分函数模型。根据训练集中HCC患者的中位风险评分将各集中的HCC患者分为高风险和低风险,然后采用Kaplan-Meier法绘制总生存曲线并采用log-rank检验比较高风险和低风险HCC患者总生存情况的差异;同时采用时间相关受试者操作特征曲线下面积(area under receiver operating characteristic curve,AUC)评估风险评分函数模型预测训练集、验证集及整体集中HCC患者1、3、5年总生存率的价值;然后再使用风险评分函数模型结合临床病理特征构建列线图并评估它对HCC患者预后的预测能力。结果 从TCGA中下载了374例HCC样品,其中有342例HCC患者的临床病理资料完整,其中训练集171例,验证集171例。最终筛选出8个与预后有关的PCD相关lncRNAs (AC099850.3、LINC00942、AC040970.1、AC022613.1、AC009403.1、AL355974.2、AC015908.3、 AC009283.1),以此建立的预后风险评分函数模型为“exp1×β1+exp2×β2…+expi×βi”(其中expi表示目标PCD相关lncRNA的表达水平,βi是目标PCD相关lncRNA多因素Cox回归分析的偏回归系数)。根据此预后风险评分函数模型得到的中位风险评分为0.89分,低风险和高风险患者在训练集中分别为86和85例、在验证集中分别为86和85例,在整体集中分别为172和170例,训练集、验证集及整体集中KaplanMeier法绘制的生存曲线比较结果均发现低风险HCC患者的总生存情况优于高风险患者(P<0.001),此模型在训练集中预测1、3、5年总生存率的AUC值分别为0.814、0.768、0.811,在验证集中分别为0.799、0.684、0.748,在整体集中分别为0.807、0.732、0.784,并且多因素Cox回归分析显示此模型是影响HCC患者总生存时间的风险因素[风险评分≥0.89分/<0.89分,RR=1.217,95%CI(1.151,1.286),P<0.001],它预测HCC患者累积总生存率的AUC(95%CI)为0.822(0.796,0.873)。构建的列线图预测1、3和5年总生存率的AUC值分别为0.843、0.839和0.834;训练集内列线图预测的1、3和5年总生存率校准曲线与理想曲线均比较靠近,提示列线图预测的总生存率与实际的总生存率较为一致。结论 本研究中筛选出的8个PCD相关的lncRNAs构建的预后风险评分函数模型可能是HCC预后的潜在标志物,以此构建的列线图预测HCC患者预后(总生存率)效能较好。