溪黄草转录组测序及生物信息学分析

作者:王继华; 蔡时可; 梅瑜; 李汉章; 杨少海*
来源:广州中医药大学学报, 2020, 37(08): 1568-1574.
DOI:10.13359/j.cnki.gzxbtcm.2020.08.028

摘要

【目的】利用高通量测序技术获得溪黄草的转录组信息。【方法】溪黄草叶片总RNA经过提取、建库、测序,从头测序(de nove)组装,获得非冗余通用基因(unigene)序列,再进行注释和比对,得到溪黄草转录组的遗传信息。【结果】共获得37 418条unigene,平均长度为1 054.1 bp,N50为1 840 bp。共有23 978条(64.08%)unigene在至少1个数据库中获得功能注释,其中2 429条(6.49%)unigene在所有数据库中均能获得注释。在真核生物蛋白质同源簇数据库/蛋白相邻的聚类(KOG/COG)数据库中注释到信号转导机制的unigene数目(1 974条,15.35%)最多。20 222条unigene在基因本体论(GO)数据库中获得注释,主要包括65个功能分类。在京都基因与基因组百科全书(KEGG)数据库中共有3 674条unigene得到注释,涉及289个代谢通路。还鉴定到大量unigene涉及信号转导、黄酮类物质合成、萜类物质合成和苯丙素生物合成。此外,采用微卫星识别工具(MISA)对组装的unigene进行简单重复序列(SSR)检测,共鉴定到9 489个SSR位点,并使用Primer 3.0设计引物。【结论】这些转录组数据为进一步了解溪黄草的生物学过程、生长发育、次生代谢通路提供了相关资源信息,也为下一步功能基因组分析、分子标记开发和遗传图谱构建提供了基础数据。

全文