摘要

基因预测一般指预测DNA序列中编码蛋白质的部分。其方法主要有两大类:一类是基于相似性的预测方法,即利用已知的mRNA或蛋白质序列为线索在DNA序列中搜寻所对应的片段,达到基因预测的目的;另一类是基于统计学模型的从头预测方法,即利用统计学模型训练出相应参数,再对基因进行预测,这种方法可不依赖已知的DNA序列进行预测。现就基因预测的方法、基因预测中存在的一些问题等做一概述。