摘要

目的通过对新型冠状病毒公共数据库的序列进行分析, 了解刺突糖蛋白(S蛋白)D614G变异时间变化和空间分布特征。方法本研究纳入截止至2020年7月21日在国内外新型冠状病毒公共数据库(GenBank、EpiCoV、CNGBdb、Genome Warehouse和NMDC)公布的核酸序列, 对各数据库获取的序列进行去重、序列过滤和比对等数据分析以确定纳入序列的S蛋白D614G变异情况, 并对包含该变异的毒株进行时间变化和空间分布特征分析。结果本研究经数据过滤后最终纳入分析的序列56 201条, 其中来自中国的序列1 060条(1.9%), 其他国家来源的序列55 141条(98.1%), 13 570条(24.1%)序列为野生型, 42 631条(75.9%)序列发生D614G变异。D614G变异最早在四川(EpiCoV数据库:EPIISL451345)和浙江(NMDC数据库:NMDC60013101-01)2020年1月24日采集样本并测序的毒株中被发现, 该2株毒株均与来自武汉(2019年12月30日)的毒株参考序列(NC045512)同源性最高, 同源性均为99.9%以上。在纳入分析不同时间的序列中, D614G变异毒株的构成比呈明显上升趋势, 自2020年2月份起至2020年6月份, D614G构成比均明显高于2019年12月份的数据, 均P<0.05, D614G变异构成比最多的国家为比利时(86.7%), 其次为英国(79.0%)和美国(76.1%), 构成比最少的国家为中国(20.2%)。在来自中国毒株的序列中, D614G变异也呈上升趋势, 自2020年3月份起至2020年6月份, D614G构成比均明显高于2019年12月份的数据, 均P<0.05。国内曾发现D614G变异毒株主要分布在广州(50.9%)、台湾(27.1%)和北京(10.8%)。结论新型冠状病毒S蛋白D614G变异毒株构成比呈现明显上升趋势, 且主要存在于国外的毒株, 应对其动态监测, 进一步了解其流行病学特点。