摘要
【目的】通过高通量测序获取千针万线草根转录组信息,在分子水平上进一步研究千针万线草根黄酮类的生物合成。【方法】采用高通量测序技术平台lllumina Novaseq 6000完成千针万线草根的转录组测序,对unigenes进行功能注释和解析黄酮类化合物的生物合成相关基因。【结果】总共得到34 137条Unigenes,平均长度为1 093.58 bp。注释到六大功能数据库(NR、egg NOG、Pfam、Swiss-Prot、GO、KEGG)中的Unigenes总数达到22 369条。千针万线草根Unigenes匹配至NR数据库的有21 510条,与黎科的甜菜、藜麦和菠菜有高度同源性;19 414条Unigenes在egg NOG数据库得到19 980个注释并划分为23类;19 942条Unigenes在GO数据库中获得69 356个注释,根据功能划分为细胞组分、分子功能及生物过程三大类,分别对应14、16、23个亚类,其中涉及生物过程较多;6 505条Unigenes富集在KEGG数据库的131条通路中,代谢相关的通路占比最大,其中筛选获得80个与黄酮类化合物代谢相关的基因,共编码16个关键酶。同时,有724个Unigenes被注释为转录因子。【结论】对千针万线草根进行转录组测序及基因功能注释,并筛选到多个与黄酮类化合物合成相关的Unigenes,研究结果丰富了千针万线草根的遗传信息,可以为进一步鉴定该物种药用成分合成的关键基因及其调控机制提供一定的参考依据。
- 单位