摘要
目的:利用高通量测序技术获得马鞭草Verbena officinalis L.的全长转录组基因信息。方法:通过PacBio Sequel高通量测序平台,对马鞭草根、茎、叶3个部位的混合样品进行全长转录组测序,并基于序列同源性对转录本进行功能注释,得到马鞭草全长转录组的遗传信息。结果:测序数据经过质控后获得197 542个高质量的转录本及169 063条环形一致性序列(CCS),检测出4955个转录因子。其中161 062个(81.53%)转录本在非冗余蛋白(NR)、真核生物相邻类的聚簇(KOG)数据库、京都基因与基因组百科全书(KEGG)、基因本体(GO)数据库、蛋白家族(Pfam)数据库和SwissProt蛋白序列数据库中均得到注释。MISA分析发现54 063个简单重复序列(SSR)位点,还预测到70 050个长链非编码RNAs (lncRNAs)和45 499个信使核糖核酸(mRNAs),并在马鞭草全长转录组中共鉴定到了60个转录本可能参与单萜类化合物的生物合成。结论:利用高通量测序技术和生物信息学分析获得了马鞭草的全长转录组信息特征,可为后期开展马鞭草功能基因鉴定、解析萜类化合物次生代谢途径及其调控机制提供参考。
- 单位