摘要

为获得多叶越南槐转录组信息特征,本研究通过DNBSEQ平台对一年生多叶越南槐进行高通量测序,Clean reads经Trinity进行De novo组装得到转录本,通过Tgicl聚类获得Unigene,将Unigene与七大功能数据库进行比对注释,得到多叶越南槐转录组的遗传信息,原始数据以上传至NCBI数据库,登录号为SRR22671440。结果显示,共得到49.29 Mb高质量序列(Clean reads),Q20达97.82%,Q30达93.81%。组装并去冗余后得到83 121个Unigene,总长度、平均长度、N50以及GC含量分别为106 667、937 bp、1 283 bp、2 001 bp和40.39%。将得到的Unigene与七大功能数据库进行比对和注释,最终分别有58 502 (NR: 70.38%)、55 682 (NT: 66.99%)、41 552 (SwissProt: 49.99%)、44 926 (KOG: 54.05%)、45 800 (KEGG: 55.10%)、34 601 (GO: 41.63%)以及40 981 (Pfam: 49.30%)个Unigene获得功能注释。经Transdecoder检测,得到45 787个CDS。此外,检测到的SSR位点有15 954个,分布于12 992个Unigene中,预测出具有转录因子编码功能的Unigene有2 274个。利用开发的SSR特异性参考引物统计注释到类黄酮和生物碱合成通路中的Unigene以及可能参与非生物胁迫、调控活性成分的转录因子家族。这些结果为后期开展功能Unigene鉴定、解析生物碱类和黄酮类化合物次生代谢途径及其调控机制等研究提供了理论依据。