摘要
具有蛋白质编码能力的小开放阅读框(sORFs)是一类长度小于100个氨基酸的重要基因组元件,在许多生物过程中发挥着重要作用.然而,由于其序列长度短、表达水平低和缺乏有效的研究方法,多年来在基因组中对sORFs编码肽的研究一直被忽视.近年来,随着核糖体谱、蛋白质组等测序技术的发展,越来越多的研究发现肽编码的转录因子在真核生物和原核生物中发挥着重要的生物学功能,从而引起了人们对转录因子的广泛关注,并逐渐成为生命科学的一个重要研究领域.在此背景下,从密码子偏好性的角度比较了人、小鼠、拟南芥和原核生物中肽编码的sORFs的序列特征.结果表明,不同物种肽编码sORFs具有一定的共性。其中,小鼠、人和原核生物的sORFs密码子偏好性较弱,大多数sORFs密码子的CAI值较低,表明这4个物种的sORFs密码子表达水平较低.进一步的分析表明,不同物种来源sORFs具有一定程度的结构无序特征.
- 单位