摘要
针对现有基于Hi-C数据的接触域边界检测算法进行改进,提出用绝缘密度统计量来表征接触域边界强度变化的绝缘密度算法(Hi-C insulation density,HiCID)。HiCID算法将网络增强技术嵌入预处理过程对原始Hi-C数据进行降噪,根据绝缘子结合蛋白(CTCF)与组蛋白修饰的富集丰度确定域边界筛选阈值,同时为不同分辨率Hi-C数据优化选择滑动窗口的大小和数量。实验结果表明,提出的接触域边界检测算法在一致性和准确性上均优于HiCDB算法,具有不依赖于特定物种的可移植性特点,且算法随Hi-C数据分辨率提高表现出更好的性能。
- 单位