基于随机森林算法的宫颈癌淋巴结转移相关基因的生物信息学筛选

作者:范淑英; 李春晓; 王婷; 周春霞; 钱海利; 王海娟; 詹启敏
来源:中国生化药物杂志, 2016, 36(04): 5-8.
DOI:10.3969/j.issn.1005-1678.2016.04.02

摘要

目的分析与淋巴结转移最相关的基因集和基因集中的关键节点性基因,为宫颈癌淋巴结转移预测潜在干预靶点。方法利用TCGA宫颈癌患者转录组数据集,使用随机森林算法对淋巴结转移最相关基因进行分析和排名,使用STRING和Cytospace对这些相关基因进行互作网络分析,筛选对其他基因具有最广泛相互作用的基因节点,使用DAVID对这些基因在整体上进行功能识别。结果获得淋巴结转移相关基因重要性排序(2784个),并获得其中的关键节点基因(前13位分别为EGFR,NOTCH1,RHOA),这些基因均与淋巴结转移显著相关(P<0.05)。与淋巴结转移最相关的基因主要聚集在趋化因子信号通路、MAPK通路、细胞间相互作用、黏着连接、细胞骨架调控、wnt通路等。对这些有意义的宫颈癌转移相关基因集在统计学上进行了验证,获得的关键节点基因如EGFR,NOTCH1,RHOA在临床水平均已发现与宫颈癌淋巴结转移显著相关。结论随机森林算法是一个有效的方法,采用此方法获得的宫颈癌转移相关的基因集有很大比例与淋巴结转移显著相关。

  • 单位
    分子肿瘤学国家重点实验室; 唐山市开滦总医院; 中国医学科学院北京协和医学院

全文