栽培种西番莲基因组序列及比较基因组分析

作者:吴艳艳; 刘洁云; 田青兰; 黄永才; 黄伟华; 夏秀忠; 杨行海; 牟海飞*
来源:基因组学与应用生物学, 2020, 39(05): 2103-2110.
DOI:10.13417/j.gab.039.002103

摘要

栽培种西番莲是中国南方广泛种植的果树,但是其基因组信息尚不清楚,严重制约了西番莲分子遗传学研究。本研究利用高通量测序得到的14.1 Gb原始数据及165.7 Mb组装到Scaffold水平、代表栽培种西番莲基因组的序列进行生物信息学分析。结果表明,西番莲基因组中含有大量的简单序列重复(simple sequence repeats, SSR)。通过与木薯和桃树基因组比对,西番莲基因组有23 053个预测基因。利用NR、Swiss Port、KEGG、InterPro、Pfam和GO数据库,西番莲预测基因能比对到282个植物基因组上。利用GO数据对注释基因的功能进行归类,即Biological process、Cellular component和Molecular function,再细化为41个二级功能,大部分基因与碳水化合物、有机酸、脂等代谢途径相关。KEGG通路富集将基因功能分为5大类19个二级功能,众多基因与新陈代谢通路相关,其中最大一类是碳水化合物代谢相关基因。通过基因家族的聚类分析,栽培种西番莲12 767个基因可以聚类到9 868个基因家族中,平均每个家族包含有1.29个基因,同时有291个特有基因家族。在进化关系中,栽培种西番莲与毛果杨和蓖麻的亲缘关系较近。本研究为西番莲的基因功能研究和分子育种奠定基础。

全文