摘要
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads) 47 742 445条,Trinity denovo组装后得到47 044条Unigenes,平均长度1 164.20 nt。BLAST分析显示分别有32 208 (68.46%)、23 049 (48.99%)、10 479 (22.27%)、17 883(38.01%)、28 201 (59.95%)、20 731 (44.07%)、55 (0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32 303个,高等植物转录因子58个家族,借助MISA软件发现10 020个SSR,其中二碱基重复最丰富,有4 336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。
-
单位四川省中医药科学院