摘要
【目的】利用已获得的纳米孔(Nanopore)长读段测序数据对意大利蜜蜂Apis mellifera ligustica的细胞内吞相关基因和全长转录本进行鉴定、分析和验证,为深入开展相关研究提供参考和依据。【方法】通过Blast工具将意大利蜜蜂全长转录本比对Nr和KEGG数据库以筛选出细胞内吞相关基因和全长转录本。采用gffcompare软件将全长转录本与西方蜜蜂Apis mellifera参考基因组(Amel_HAv3.1)上注释的转录本进行比较以优化已注释基因的结构。使用Astalavista软件鉴定细胞内吞相关基因的可变剪接(Alternative splicing,AS)事件类型,利用IGV浏览器对剪切体结构进行可视化,通过PCR验证AS事件的真实性。利用TAPIS pipeline进行可变多聚腺苷酸化(Alternative polyadenylation,APA)位点预测和分析,并通过MEME软件鉴定APA位点上游的基序(motif)。【结果】共鉴定到意大利蜜蜂细胞内吞相关的170个基因与991条转录本。共优化了89个细胞内吞相关基因的结构,其中5′端延长的基因有36个,3′端延长的基因有35个,5′端和3′端同时延长的基因有18个。鉴定到细胞内吞相关的28个基因的666次AS事件,其中最丰富的AS类型是3′端可变剪接(Alternative3’splice site,A3SS)。PCR结果证实了涉及整合素β-nu样异构体基因、Ras样GTP结合蛋白基因和rab11家族相互作用蛋白4基因的2种类型的4次AS事件真实性。共鉴定到120个细胞内吞相关的基因含有1个及以上的APA位点,并在APA位点上游鉴定到多个motif,一致性序列为NBMNHHHBMNSNNCBNVSNNNNNNNNNNNVNNNN。【结论】鉴定到意大利蜜蜂细胞内吞相关的170个基因及991条全长转录本,发现细胞内吞相关基因发生大量的AS事件并含有丰富的APA位点,优化了西方蜜蜂参考基因组上注释的细胞内吞相关基因的结构。
- 单位