摘要
【目的】利用高通量测序技术获得大青的转录组信息特征。【方法】通过高通量测序平台Illumina HiSeqTM 2500对大青进行转录组测序,采用Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到大青转录组的遗传信息。【结果】测序数据经过质控后共获得26 394 223个高质量的Reads,通过de novo组装获得100 191个Unigene,N50长度为1 055 bp,平均长度724.4 bp。其中59 690个(59.58%)Unigene在NR、SwissProt、KOG、GO、KEGG数据库中均得到注释。其中KEGG数据库注释到38 260个Unigene,涉及136条代谢通路。在大青转录组中共鉴定到407个Unigene参与萜类化合物的生物合成,165个Unigene涉及类黄酮生物合成,29个Unigene参与黄酮和黄酮醇生物合成,37个Unigene参与异黄酮生物合成,同时,还鉴定到210类转录因子。MISA分析发现6 680个Unigene包含8 640个简单重复序列。【结论】利用高通量测序技术和生物信息分析获得了大青的转录组信息特征,这些数据可为后期开展功能基因鉴定、解析黄酮类化合物次生代谢途径及其调控机制奠定研究基础。
- 单位