摘要

自动、准确地识别DNA甲基化修饰位点对于研究基因的调控、转录和表达机理,有针对性地开发癌症靶向治疗药物有重要意义.然而,基于核酸频率统计特征和物化属性伪核酸成分统计特征并不能很好地反应DNA甲基化位点的模式信息,所构建的DNA甲基化位点预测器精度也不高.因此,文中提出从3个不同的视角抽取DNA序列上的核酸频次统计信息、位置统计信息和空间结构属性信息,并将其融合为一种新的统计特征向量,然后在相同的基础数据集上采用SVM分类器和严格的Jackknife测试方法进行实验验证.结果表明:该方法构建的预测器较当前最好的iDNA-methyl预测器,在Acc、Mcc和AUC 3个性能指标上分别提高了11.85%、24%和11.3%;该研究表明在DNA甲基化位点预测问题上,核酸序列的频次统计信息、位置统计信息和空间结构属性信息具有较好互补性,这3个视角相融合得到的特征向量能够更好地反映DNA甲基化修饰位点的模式特征,提高DNA甲基化位点的预测精度.