摘要
此试验旨在通过研究阿拉善双峰驼基因组遗传变异信息,找到与其生物学特性相关的候选基因,以期对阿拉善双峰驼分子特征做出评价,并为双峰驼重要经济性状的功能基因定位提供基础数据。提取12头双峰驼基因组总DNA,制备基因组文库,经Illumina HiSeqTM平台测序,利用生物信息学手段对重测序数据进行分析,对识别的SNPs和InDels进行注释。结果:共计得到367.98 Gb序列数据,平均测序深度15×,测序得到2 453 332 756个reads,比对到参考基因组的reads为2 003 009 380,匹配率为81.65%;共确定了6 759 037 SNPs和976 715 InDels,共计注释15 037个基因。其中与耐热性相关的候选基因是HSF1、HSPA9、HSPA4;与胰岛素相关的候选基因是EEF1A1、EEF1A12、GSK3A、GSK3B、PDX1、PAX6、PPARs和IRSs;与高血压相关的候选基因是KLK和PPARs;与耐渴性相关的候选基因是NFAT5、BGT1和AQPs。此研究基本阐明了双峰驼的遗传变异信息,从基因组层面解释了双峰驼的生物学特性,为后续分析与经济性状相关的遗传学机制、功能基因的研究和保护双峰驼品种资源提供了基因组数据,并为与经济性状相关的功能基因定位提供新的思路和线索。
- 单位