摘要

目的获得三叉苦Melicope pteleifolia转录组信息特征。方法以三叉苦幼苗根、茎、叶混合样品为对象,采用二代高通量测序平台Illumina HiSeqTM 2000进行转录组测序并进行系统的生物信息学分析。结果转录组测序分析共获得47 045 040条高质量序列(clean reads),Trinity de novo组装获得67 956条unigenes,平均长度787 nt。BLAST分析显示分别有42 749(61.92%)、31 152(45.84%)、26 563(39.0 9%)、17 481(25.72%)条unigenes在NR、Swiss-port、KOG、KEGG数据库得到注释信息,参与生物过程、细胞组分和分子功能3个GO类别的47个小组,共9807条unigenes注释到130个KEGG代谢通路中,筛选到19条次生代谢通路,KOG功能分类分析获得25个不同的KOG功能类群。预测共有高等植物转录因子56个家族;借助MISA软件发现7 748个SSRs,三碱基重复SSRs数量最丰富,有4 117个,出现频率为53.1%,五碱基重复SSRs相对较少,占2.2%。结论利用高通量测序技术和生物信息分析获得三叉苦转录组信息特征,为后续三叉苦功能基因的挖掘、次生代谢途径解析及其调控机制研究奠定基础。