基于PacBio三代测序的高质量汶上芦花鸡基因组的组装

作者:薛倩; 邢伟杰; 李国辉; 周成浩; 张会永; 殷建玫; 蒋一秀; 朱云芬; 韩威*
来源:中国畜牧兽医, 2023, 50(10): 3869-3881.
DOI:10.16431/j.cnki.1671-7236.2023.10.001

摘要

【目的】汶上芦花鸡为中国唯一的芦花羽地方鸡品种资源,芦花基因可伴性遗传,芦花羽性状可用于雏鸡的自别雌雄。试验旨在丰富家鸡基因组信息,获取汶上芦花鸡全基因组序列,为鸡伴性芦花羽分子机制研究提供材料。【方法】以汶上芦花鸡为试验动物,基于BGI MGISEQ构建小片段文库进行基因组特征评估,利用PacBio三代测序技术、Hi-C技术组装及构建汶上芦花鸡全基因组信息数据库,利用生物信息学方法对获得的基因组序列进行组装和功能注释。【结果】试验共获得BGI二代测序数据量59.70 Gb;获得PacBio三代测序数据量31.13 Gb, reads平均长度为15 362 bp;获得Hi-C数据量95.37 Gb;拼接和初步组装得到基因组大小为1.12 Gb,经Hi-C辅助组装后,共有1.07 Gb的序列挂载到41条染色体上,挂载率95.62%,基因组contigs N50为9.61 Mb, scaffold N50为91.29 Mb, BUSCO评估为98.50%,基因组连续性和完整度良好;预测基因组有22.57%的重复序列,有426个tRNAs、56个rRNAs、260个miRNAs和308个snRNAs;共预测得到蛋白编码基因17 338个,其中96.00%的基因在数据库中得到了功能注释;组装获得汶上芦花鸡Z染色体长度约88.23 Mb,预测并注释到蛋白编码基因742个,这些基因显著富集于氨基酸、脂肪等代谢相关通路,在汶上芦花鸡Z染色体上准确定位了TYRP1、CDKN2A、SLC45A2等羽色相关基因。【结论】研究获得了汶上芦花鸡高质量染色体水平基因组,丰富了家鸡基因组遗传信息,准确定位了Z染色体上一些羽色相关基因。研究结果可为从全基因组水平挖掘汶上芦花鸡优异性状调控机制奠定基础。

全文