摘要

目的通过基因共表达权重网络分析(WGCNA)探讨长链非编码RNA(lncRNA)与乳腺癌的不同亚型性状及发病机制的关系。方法收集GEO数据库50个样本中不同乳腺癌亚型的转录组数据,以14 032个lncRNA的表达模式为基础,用WGCNA分析共表达的lncRNA构建聚类模块,并与乳腺癌亚型进行相关性分析。同时将各模块中关键lncRNA与18 904个蛋白编码基因做相关性分析,随后通路富集分析研究其功能。结果共检测到15个lncRNA模块,其中9个模块与乳腺癌的各亚型高度相关。预测到的关键lncRNA基因ADARB2-AS1,已有验证与乳腺癌HER2阳性亚型高度相关。通过联系基因表达矩阵,获得由关键lncRNA和mRNA构成的乳腺癌基因调控核心网络;被调控的基因富集于93个GO功能注释上。结论利用WGCNA方法,通过计算不同组织中的基因表达矩阵,鉴定有生物学意义的基因模块,可进一步验证lncRNA与乳腺癌的亚型特异性有关,有助于揭示乳腺癌相关受体以及各亚型产生的遗传机制。

全文