摘要

白芷为常用的药食同源的品种,既是临床常用中药,也是香料,用途十分广泛。为获取白芷全基因组序列信息,该研究用杭白芷叶片DNA为材料,采用Nanopore测序技术构建杭白芷全基因组数据库,并利用生物信息学方法对获得的核苷酸序列进行组装、功能注释以及进化分析研究。结果表明:(1)原始测序数据过滤后获得662 Gb三代数据,Read N50约为32 932 bp,经过组装得到杭白芷基因组大小为5.6 Gb,Contig N50约为806 638bp。(2)组装后的序列通过与KOG、GO、KEGG等功能数据库比对,得到了功能注释的基因共有66.47%,KOG功能注释结果表明杭白芷的蛋白功能主要集中在一般功能预测、翻译后修饰、蛋白质转换、伴侣以及信号转导机制;GO功能分类表明杭白芷的基因集中在生物学过程及细胞组分;KEGG通路注释表明参与代谢途径的基因占主要地位。(3)杭白芷的基因集中在45个BGLU家族基因。该研究首次利用第三代测序技术对杭白芷全基因组进行解析,为杭白芷的系统生物学研究奠定基础,有利于进一步深入开发和利用杭白芷,同时也对杭白芷中BGLU家族基因进行初步分析,为后续进一步研究BGLU在杭白芷生长发育中的功能提供了重要的理论基础。