摘要
研究表明,乳腺肿瘤细胞染色质开放区域上的转录因子显著影响乳腺癌患者的临床表型和预后。然而在单细胞层面,这些调控元件如何调控乳腺癌发生发展尚不明确。为此,本研究从GEO数据库中下载了45 216个正常和乳腺肿瘤组织细胞的染色质可及性测序(scATAC-seq)数据。根据标记基因在细胞群的基因活性得分进行细胞类型注释后得到七种乳腺细胞类型。皮尔逊相关性分析表明,肿瘤和正常乳腺样本的上皮细胞存在明显的染色质可及性差异,且乳腺上皮细胞存在高度样本间异质性(PCC=-0.07),暗示其是乳腺癌恶性的主要细胞类型。为了探究正常和恶性乳腺上皮细胞的差异可及性区域中转录因子基序(motif)的富集情况,在提取上皮细胞群后对五个上皮亚群的特征开放区域进行motif富集分析。结果表明,乳腺癌恶性上皮细胞中有194个转录因子显著富集(P<0.001),可能涉及乳腺肿瘤发展和癌症转移等调控过程。对每个亚群中富集程度最高的转录因子的活性分数进行计算及转录组数据验证,结果进一步显示这些差异调控元件可能与乳腺细胞恶性发展相关。通过描绘转录因子motif在不同乳腺癌亚型中的可及性差异,发现SNAI2在三阴性乳腺癌样本中具有显著高的可及性,提示SNAI2在三阴性乳腺癌中的潜在特异性调控作用。
- 单位