摘要

为研究印度南瓜(Cucurbita maxima Duch.)叶绿体基因组密码子的使用模式及其偏好性的主要影响因素,以印度南瓜叶绿体基因组为对象进行研究,从NCBI中下载印度南瓜叶绿体基因组完整序列,从而筛选蛋白编码序列,最终选定52条适宜的密码子采用CUSP、Codon W 1.4.2、SPSS 16.0等生物信息学软件对其进行偏好性分析,从而筛选确定出印度南瓜的最优密码子。结果表明:印度南瓜叶绿体基因密码子中GC1 (47.09%)和GC2 (39.57%)中的GC含量明显高于GC3 (28.74%),说明密码子末位碱基以A/T结尾为主;印度南瓜的有效密码子数(effective number of codon, ENC)均值为45.62,表明密码子偏好性普遍较弱。中性绘图分析、各含量之间的相关性及显著性分析分析表明:自然选择是影响印度南瓜密码子偏好性的主要因素。使用基因的密码子使用频率与同义密码子平均使用频率偏差的量化值(effective number of -codonplot analysis, ENC-plot)分析表明,大多数编码基因散落分布于标准曲线下方,有10个基因的ENC比值-0.05~0.05范围内,占总基因数的19.23%,表明碱基突变也可能影响印度南瓜部分密码子偏好性的形成。利用奇偶校验规则2 (PR2-bias plot analysis PR2-plot)分析表明,密码子第3位T、G的使用频率分别高于A、C。共在印度南瓜中筛选满足相对同义密码子使用度(relative synonymous codon usage, RSCU)>1且高表达基因的RSCU与低表达基因的RSCU的差值(RSCU of high expression gene reduces low expression gene, ΔRSCU)≥0.08这两个条件的17个最优密码子,分别为:GCA、GCU、CGU、UGU、GAA、GGU、AUU、UUA、AAA、UUC、CCA、AGU、UCU、ACC、ACU、GUA、GUU,大部分最优密码子以U或A结尾。该研究可为完善印度南瓜叶绿体基因组学、外源基因密码子的优化及其表达提供数据参考。