摘要

目的:基于全基因组基因表达数据,挖掘胆道闭锁(Biliary atresia,BA)潜在的分子亚型,并识别分子亚型相关的核心基因,进一步探究BA的发病机理。方法:基于样本内基因间相对表达秩次关系,分析BA基因表达谱数据集(GSE46960、GSE15235),挖掘潜在的具有亚型识别能力的基因对,再通过聚类分析识别分子亚型并验证。然后,利用加权基因共表达网络分析识别BA亚型相关的基因模块,筛选亚型相关的核心基因。结果:建立了基于样本内基因间相对表达秩次关系识别疾病分子亚型的方法。利用该方法在BA基因表达数据集GSE46960中,识别了两种主要的分子亚型,并在独立数据集GSE15235进行了验证。结合加权基因共表达网络分析和蛋白质互作网络分析,发现了10个与BA分子亚型相关的基因(LUM、COL6A3、FBN1、SPARC、DCN、LAMA4、FAP、ANTXR1、LAMA2、COL1A2),它们可能是决定BA引起肝炎或肝纤维化的关键因素。结论:BA存在两种主要的潜在分子亚型,与BA病情进展结果相关。