摘要
栽培种西番莲是中国南方广泛种植的果树,但是其基因组信息尚不清楚,严重制约了西番莲分子遗传学研究。本研究利用高通量测序得到的14.1 Gb原始数据及165.7 Mb组装到Scaffold水平、代表栽培种西番莲基因组的序列进行生物信息学分析。结果表明,西番莲基因组中含有大量的简单序列重复(simple sequence repeats, SSR)。通过与木薯和桃树基因组比对,西番莲基因组有23 053个预测基因。利用NR、Swiss Port、KEGG、InterPro、Pfam和GO数据库,西番莲预测基因能比对到282个植物基因组上。利用GO数据对注释基因的功能进行归类,即Biological process、Cellular component和Molecular function,再细化为41个二级功能,大部分基因与碳水化合物、有机酸、脂等代谢途径相关。KEGG通路富集将基因功能分为5大类19个二级功能,众多基因与新陈代谢通路相关,其中最大一类是碳水化合物代谢相关基因。通过基因家族的聚类分析,栽培种西番莲12 767个基因可以聚类到9 868个基因家族中,平均每个家族包含有1.29个基因,同时有291个特有基因家族。在进化关系中,栽培种西番莲与毛果杨和蓖麻的亲缘关系较近。本研究为西番莲的基因功能研究和分子育种奠定基础。
- 单位