摘要

为全面了解Paenarthrobacter ilicis CR5301的遗传背景,深入解析CR5301转化莱鲍迪甙C(rebaudioside C,RC)的关键酶,采用二代Illumina HiSeq和三代Nanopore相结合的测序方法,对CR5301进行全基因组测序和关键酶预测分析。结果显示,CR5301基因组为1个闭合环状染色体DNA分子,不含质粒,基因组序列全长4 748 281 bp,GC含量62.92%,共编码4 458个基因,同时含有4个基因岛、1个前噬菌体和14个CRISPR-Cas编码序列。CR5301是P. ilicis物种第1个测定基因组完成图的菌株,也是Paenarthrobacter菌属已知基因组最大的菌株。基因组共线性分析和16S rRNA基因系统进化树分析结果一致表明,P. ilicis CR5301与P. aurescens具有更近的亲缘关系,而与P. ureafaciens的亲缘关系较远。7个蛋白质数据库综合注释分析发现,P. ilicis CR5301基因组共含有523个碳水化合物活性酶基因,其中18个糖苷酶基因可能是CR5301转化RC的关键酶基因。最后,通过ProtParam、SOPMA生物信息学软件,预测了18个糖苷酶的物化性质和二级结构。这些结果为CR5301的RC转化机制研究提供了清晰、完整的遗传信息,并且为P. ilicis物种广泛的生物学研究提供了完整、可靠的参考基因组序列,对今后P. ilicis物种生物学研究具有重要的参考价值和普遍的借鉴意义。