摘要
为了深入了解甘葛藤转录组的整体水平及黄酮类生物合成通路基因。利用高通量测序PacBio Sequel平台,以甘葛藤根、茎、叶的混合样品为材料,使用单分子长读数测序技术(SMRT)对甘葛藤进行全长转录组测序及分析。平台共获得10 994 967个高质量reads和384 072条全长非嵌合序列(FLNC),测序数据经质控后获得90 856个转录本;获得的所有转录本经NR、SwissProt、KOG、KEGG、GO数据库进行注释和功能分类,结果有85 239个单基因被注释,NR注释数量最多为84 675个,占93.2%;KEGG注释的基因最少,22 330个基因被注释到132条途径,代谢途径分布的基因较多(9 368,41.95%)。预测到3 507个转录因子,bHLH转录因子家族的基因最多。14 127个基因被分配到17个R基因类别,主要为RLP类。检测到33 660个SSR序列,多为AG/CT类型。分析黄酮类生物合成途径,发现与黄酮类合成相关的基因110个,其中,26个编码HCT,3个编码CHS,7个编码CHI。PacBio测序平台能获得更长的转录本,SMRT技术能够深入挖掘甘葛藤转录数据,比第二代测序技术能够获得更高的转录本注释率。在高通量全长转录组水平对甘葛藤进行了研究,为甘葛藤的分子生物学研究提供了较可靠、全面的转录组数据,为进一步开发甘葛藤的分子标记和挖掘优良基因提供了科学依据。
- 单位