摘要

目的对肺癌亚型肺鳞状细胞癌(肺鳞癌)和肺腺癌进行预测并找出分子标记。方法通过研究两种不同癌症亚型中mRNA表达量,选取有差异有统计学意义的mRNA,利用极限梯度增强(extreme gradient boosting,XGBoost)算法构建模型,预测亚型分类,并比较其与逻辑回归分类模型和支持向量机分类模型的预测性能。结果基于XBGoost模型的预测准确率为96. 55%,曲线下面积为99. 04%,优于逻辑回归分类模型和支持向量机分类模型。同时,找到11个基因作为两种亚型的分子标记。结论肺癌两种亚型的在分子层面存在明显差异特征,将辅助临床医生进行疾病亚型预测。

  • 单位
    首都医科大学附属北京儿童医院