广西莪术全长转录组测序及生物信息学分析

作者:胡营; 彭玉德; 雷明; 唐美琼; 梁莹; 韦筱媚*; 缪剑华*
来源:中国现代中药, 2023, 25(07): 1417-1427.
DOI:10.13313/j.issn.1673-4890.20221109006

摘要

目的:获取广西莪术的全长转录组信息,了解其转录组的整体水平,挖掘姜黄素类生物合成通路基因。方法:利用Pacbio Sequel测序平台对广西莪术根、茎、叶、花4个部位的混合样品进行全长转录组测序,结合生物信息学等方法进行功能注释、代谢通路分析、简单序列重复(SSR)分析。结果:共获得原始数据14.47 Gb,经纠错、过滤、去冗余得到高质量一致性序列151 218条。对所有转录本在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt七大功能数据库进行注释及分类,结果有128 414个基因被注释,占比84.92%。共有325个基因参与姜黄素的生物合成,编码4-香豆酸-辅酶A连接酶、苯丙氨酸解氨酶、姜黄素合成酶、二酮-辅酶A合成酶、肉桂酸-4-羟化酶和咖啡酰辅酶A-O-甲基转移酶6个关键酶。MISA分析共发现32 459个SSR位点,以单核苷酸重复数量最多,占全部重复类型的38.63%;1~3个核苷酸重复序列占主导位置,占总SSR位点的93.58%。结论:在高通量全长转录组水平对广西莪术进行研究,对姜黄素合成相关基因进行了挖掘,为后续阐明广西莪术姜黄素生物合成分子机制提供依据,为进一步研究广西莪术的分子标记和优良基因挖掘提供数据基础。

全文