基于距离转换参数优化的HiC数据增强分析

作者:刘珂; 丰继华*; 黄月月; 范力栋
来源:基因组学与应用生物学, 2021, 40(01): 421-428.
DOI:10.13417/j.gab.040.000421

摘要

高通量染色质构象捕获(HiC)技术可反映染色体各位点之间的接触情况,为研究染色体三维空间结构和基因共调控机制提供依据。但目前受到测序技术和实验成本的制约,生物实验通常只能获得大量中低分辨率HiC数据,造成染色质远距离接触信息的缺失,为此,本研究将最短路径原理应用于增强低分辨率的HiC数据。首先将染色体接触数据转换为距离矩阵,利用Floyd算法对其进行最短路径更新后,再将其逆变换为增强的HiC数据,从而实现对远距离接触信息的恢复。在距离转换过程中,以Spearman相关系数作为评估指标,利用自适应权值粒子群算法(APSO)对转换参数进行全局寻优。本研究对人类不同组织细胞(人B淋巴细胞系(GM12878),人胚肺成纤维细胞系(IMR90)和人类白血病细胞系(K562)) HiC数据进行了增强,结果表明该算法能够对不同下采样的HiC数据显著增强。本研究的研究思路可为HiC数据增强提供有益借鉴。

全文