广州相思子全长转录组测序及分析

作者:秦双双; 韦坤华; 梁莹; 韦范; 黄燕芬; 唐美琼*; 缪剑华*
来源:中国现代中药, 2023, 25(07): 1407-1416.
DOI:10.13313/j.issn.1673-4890.20221109010

摘要

目的:获得广州相思子Abrus pulchellus subsp. cantoniensis (Hance)Verdc.全长转录本。方法:利用PacBio Sequel测序平台,通过对广州相思子的根、茎、叶3个部位混合样品开展三代全长转录组测序,并对测序数据进行生物信息学分析。结果:共获得原始测序数据14.55 Gb,最终获得转录本序列172 829条,N50长度为1572 nt,鸟嘌呤和胞嘧啶(GC)占比为40.86%。基因注释中,共有158 888 (91.93%)个转录本被成功注释;基因本体(GO)数据库注释中,102 457个(59.28%)转录本分为生物学过程、细胞组成和分子功能三大类46个功能组;真核生物相邻类的聚簇(KOG)数据库注释中,一般功能预测的转录本最多,为22 461个;信号转导机制、翻译后修饰、蛋白反转和分子伴侣亦为其主要功能途径;京都基因与基因组百科全书(KEGG)注释到转录本有99 847个,其中参与广州相思子生物合成和其他次生代谢有4530个。基因结构分析中,共得到92 344条编码序列,4800个转录因子隶属于59个转录因子家族。此外,简单序列重复(SSR)标记分析表明,40 050处SSR位点中单碱基重复的SSR数目最多,其次是包含腺嘌呤(A) G/C胸腺嘧啶(T)的二碱基重复SSR。结论:获得的广州相思子全长转录组数据可为后续基因功能、代谢通路调控及分子标记开发等研究提供数据支撑。

全文