摘要

油茶是中国特有的食用木本油料作物资源。本研究利用RNASeq技术对赣南油茶叶片进行转录组测序,并将得到的数据进行从头组装去冗余后获得120 202 个Unigenes。在Nr、Nt、SwissProt、KEGG、KOG、Pfam、GO数据库中分别比对到89 522、91 640、59 200、63 239、61 777、57 869、66 370 个Unigenes,有103 550 个Unigenes (占总Unigene的86.15%)至少在一个数据库中得到注释。Nr数据库比对结果显示油茶与同属的茶(C. sinensis)同源性最高;KOG功能注释信息61 777 个,可分为25 个基因功能大类;与GO数据库比对,共得到265 383 个GO功能注释,可分为46 个功能亚类,其中细胞组成大类中的细胞解剖实体注释基因数量为最多。KEGG数据库共涉及5 大类19 个亚类相关通路,其中与代谢相关的通路分布最多。在注释到的58 个转录因子家族中,排名前五的家族依次为MYB、AP2-EREBP、bHLH、WRKY、NAC,这些转录因子家族可能参与并调控油茶的生长发育、抗逆、次生代谢等生物学途径。使用Transdecoder检测出64 399 个CDS,同时还检测出55 039 个SSR分布于36 789 个Unigenes中,以及预测出2 865 个编码转录因子的Unigenes。本研究进一步充实转录组数据库及为其功能基因挖掘、分子标记辅助育种和遗传多样性研究提供理论基础。