薏苡转录组测序及基因功能注释

作者:欧阳雨晴; 李玲玲; 石好宇; 赵艺; 朱甫臻; 尹艳燕; 王灵芝*
来源:中南药学, 2021, 19(07): 1286-1293.

摘要

目的构建薏苡转录组数据库,为薏苡的功能基因挖掘、分子标记开发和遗传育种提供序列信息。方法取薏苡不同发育时期的各组织部位提取RNA,利用Illumina Hiseq 4000高通量测序平台进行测序,利用功能数据库进行基因功能注释和生物信息学分析。结果共获得65.57 Mb Clean reads,通过质量控制和De novo组装,获得76 164个unigene,平均长度为1023 bp。与非冗余核酸序列数据库(NT)、非冗余蛋白数据库(NR)、蛋白质直系同源簇数据库(COG)、京都基因组百科全书(KEGG)、SwissProt、基因本体论数据库(GO)和InterPro等数据库进行比对,共有59 460个unigene获得注释。其中,49 092个unigene被注释到NR数据库中,有51.73%与高粱具有同源性;27 407个unigene被注释到GO数据库,根据GO功能分为三大类,56个功能分支;20 670个unigene在COG数据库中得到注释,根据功能的不同分为25类;30 941个unigene被注释到KEGG数据库,分属于126条代谢途径,其中与三酰甘油生物合成相关的unigene有257个。本研究共获得的51 160个编码蛋白框(CDS)序列中有9个与谷蛋白相关;共检测到3324个简单重复序列(SSR),分布于11 101个unigene;获得了22 764个单核苷酸多态性(SNP)位点。结论本研究所获薏苡转录组测序的各项数据,可用于后续薏苡种植资源评价和遗传育种,进一步提高薏苡药用价值。