摘要
为了深入分析和探索豆科模式植物蒺藜苜蓿的mRNA完整结构,使用单分子长读数测序技术(single-molecule long-read sequencing technology,SMRT)对蒺藜苜蓿进行全长转录组测序及分析。共获得7 728 183个subread和509 014条全长非嵌合序列(full-length non-chimeric read,FLNC),通过比对分析发现,94.36%的序列与93.01%的序列分别与蒺藜苜蓿R108与A17参考基因组匹配。总计存在8 406种可变性剪接,其中主要的剪接方式为内含子保留(intron retention,RI)。共发现23 926个基因,其中12 049个基因存在295 545条转录本,在这些转录本中至少存在一个poly(A)位点。此外,共鉴定出3 223条转录因子,6 595条长非编码RNA(long non-coding RNA,lncRNA)和479条融合转录本。使用SMRT技术能够深入发掘蒺藜苜蓿转录数据,也为更好地利用蒺藜苜蓿基因组资源提供数据补充。
- 单位