摘要
衰老的过程中伴随着DNA甲基化的变化,DNA甲基化成为重要的衰老生物标志物之一。近年来,人们对衰老领域的研究越发火热,年龄预测有助于研究生物衰老问题,但预测精度还有待进一步提高。以往的研究大多基于线性回归模型,使用DNA甲基化数据中与年龄高度相关的Cp G位点作为特征进行年龄预测。相比机器学习模型,使用深度学习模型对多特征任务包容性更强,能够选取更多的Cp G位点作为特征。在Illumina 27K和Illumina 450K阵列的甲基化数据中,选择共同的21 368个Cp G位点的甲基化数据作为输入,使用多层感知机建立泛组织年龄预测方法 MLPAge对年龄进行预测,将MLPAge与泛组织年龄预测方法行业中的标准Horvath353Cp G时钟进行了比较。在来自8项研究的2 310个样本的独立验证集中,其绝对中位数误差(MAD)为3.77年。研究发现,多层感知机能够更好地提取与年龄相关的特征,在年龄预测方面具有更高的准确度,为该领域提供了一种新的基于深度学习的方案。
- 单位