锦绣龙虾全长转录组测序分析

作者:周钱森; 任宪云; 史鲲鹏; 于振兴; 刘萍; 李健*
来源:海洋渔业, 2021, 43(05): 542-552.
DOI:10.13233/j.cnki.mar.fish.2021.05.004

摘要

为了获得锦绣龙虾(Panulirus ornatus)丰富的转录组信息和功能基因,采用PacBio平台的Single Molecule Real-Time测序技术,对锦绣龙虾鳃、肝胰脏、肌肉、胃、肠、脑和心脏混合组织进行全长转录组测序,首次获得锦绣龙虾的全长转录本文库。通过测序拼接和去冗余后共获得13 297条Unigene,平均长度为2 627 bp,获得12 660个蛋白编码区和6 315条长链非编码RNA序列。采用Micro Satellite (MISA)软件检测及分析其中的简单重复序列(simple sequence repeat, SSR)位点信息,共检测出14 277个SSR位点,分布在8 813条Unigene中。利用NCBI非冗余蛋白序列数据库(non-redundant protein sequences, NR)、基因功能描述分类系统(gene ontology, GO)、蛋白质真核同源数据库(eukaryotic orthologous groups, KOG)、京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)等数据库对全长序列进行功能注释,其中11 806条序列得到NR数据库注释,分别比对到424个物种,其中与钩虾(Hyalella azteca)基因相似的序列最多,为3 907条;将获得的锦绣龙虾单基因簇与GO数据库进行匹配,划分为细胞组分、分子功能、生物学过程3大类;KOG功能注释将9 433条单基因簇分为26个功能组分,其中一般功能预测的最多,为1 413条;KEGG注释结果发现,与信号转导通路以及转运、分解代谢通路中注释的基因较多。通过全长转录组测序数据分析及功能注释,可为进一步了解锦绣龙虾的生物学特性、基因功能、相关代谢途径和信号通路等提供理论基础。

全文