摘要

目的 基于代谢组学和机器学习算法探究血浆代谢物对胃癌的诊断价值。方法 分别收集20例胃癌患者(胃癌组)和20名健康自愿者(健康对照组)的血浆样本,用甲醇提取血浆样本中代谢物,对提取的代谢物进行液相色谱串联质谱分析;通过与mzCloud、mzVault和Masslist数据库比对,对分析后的代谢物进行注释;以变量权重值(variable importance of projection,VIP)> 1、P <0.05,log2|Fold Change|> 1的标准筛选2组血浆差异代谢物;采用超几何检验将筛选出的差异代谢物富集至京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)数据库进行富集分析,确定2组间的差异代谢通路;通过Boruta算法建立基于特征代谢物的诊断模型和绘制受试者工作特征曲线(receiver operating characteristic,ROC),确定胃癌血浆特征诊断性代谢物,并计算其在2组中的相对含量。结果 从2组血浆提取物中共筛选出230个差异代谢物;富集到5条代谢差异通路,分别为苯丙氨酸代谢,苯丙氨酸、酪氨酸和色氨酸的生物合成,精氨酸的生物合成,组氨酸代谢,泛酸和辅酶A的生物合成;共确定9个重要的特征诊断性代谢物,分别为天门冬氨酸、苯乙胺、鸟氨酸、马尿酸、瓜氨酸、泛酰巯基乙胺、1–甲基组胺、酪氨酸及组氨酸。胃癌组血浆中9种特征诊断性代谢物相对含量均明显低于健康对照组(P <0.05)。结论 富集到的5条代谢差异通路可能参与了胃癌的发展过程,确定的9种特征诊断性代谢物可作为胃癌诊断的生物标志物。代谢组学与机器学习算法相结合有助于确定胃癌诊断标志物。

  • 单位
    东南大学; 公共卫生学院; 江苏省肿瘤医院