摘要
在人类基因组测序已经完成的"后基因组"时代,对基因组序列的功能注释,尤其是各种DNA调控元件的鉴定,已成为进一步理解人类基因组复杂机制的瓶颈问题.最近,针对染色质状态图谱的大规模研究工作,揭示了各类DNA元件特征性的染色质修饰标记.这些研究结果推动了一系列基于有监督和无监督学习的DNA元件预测方法的产生,其中一些方法已经成功应用于多个基因组的DNA元件预测,并且已成为未知基因组的常规注释工具.这些预测方法因其算法特点和预测策略不同而适用于不同类型的DNA元件预测任务.大多数情况下,使用者需要联合使用多个预测方法来达到预测敏感性和特异性的平衡.尽管各类算法在DNA元件预测中都有一些成功的应用,但每一类算法都有其特有的弊端,需要使用者认真避免.本文回顾了前期和当下DNA元件预测方法的主要类型,全面分析了各类方法的优缺点,指出了下一步可以改进的方向.本综述中的分析和观点有助于读者深入理解DNA元件预测算法的主要原则,进而在相关研究中更好地应用这些方法.
-
单位军事医学科学院放射与辐射医学研究所; 蛋白质组学国家重点实验室