摘要

目的获得热带臭虫转录组数据,为后续基因功能研究奠定基础。方法基于Illumina NovaSeq 6000高通量测序平台,对热带臭虫混合样本进行测序,采用Trinity软件组装有效测序数据获得unigenes。将unigenes分别与非冗余蛋白数据库(NR)、基因本体论(GO)、京都基因和基因组百科全书(KEGG)、直系同源蛋白分组比对数据库(eggNOG)和注释蛋白数据库(Swiss-Prot)进行比对和功能注释,利用MISA软件对热带臭虫的unigenes进行简单重复序列位点分析,使用Samtools和GATK软件检测热带臭虫单核苷酸多态性(SNP)。结果转录组测序数据质控后获得5.49 Gb高质量数据,组装后获得21 619个unigenes,总长度为29 322 540 bp,平均长度为1 356 bp。将unigenes序列与5个公共数据库进行比对和功能注释,得到45 362个有功能注释的unigenes,预测发现10 906条编码区序列,检测到7 754个简单重复序列(SSR)位点信息和33 144个SNP位点信息。结论报道并构建了热带臭虫转录组数据库,并对21 619个unigenes进行组装和功能注释分析,该数据的获得可为后期热带臭虫的功能基因研究、SSR和SNP分子标记开发、遗传多样性分析以及遗传图谱构建等奠定基础。