摘要
目的分析感染性疾病的微生物宏基因组测序结果,比较两个数据库注释结果的一致性。方法收集感染性疾病患者的不同类型临床标本,进行宏基因组二代测序,分别采用NCBI NR数据库和Meta Phl An2数据库注释测序结果,并进行一致性检验。结果 2019年6月—2020年10月,在上海市4家医院内收集疑似感染性疾病患者174份标本的宏基因组测序数据进行分析。NCBI数据库阳性检出率为67.2%,Meta Phl An2数据库阳性检出率为93.1%。不同类型标本的微生物检出率存在差异,外周血和脑脊液的检出率相对较低,其他标本的检出率较高。基于原始注释结果,按照检出微生物种类(细菌、病毒、真菌、未检出),两个数据库的注释结果一致性仅为36.8%,Kappa值为0.1779(Z=5.278 1,P<0.000 1)。分别调整两个数据库的判读标准之后,一致性提升为73.0%,Kappa值为0.5712(Z=11.736 2,P<0.000 1);其中,脑脊液标本中微生物种类的检出一致性最高,为74.0%,Kappa值为0.512 0(Z=5.139 2,P<0.000 1)。结论两个数据库均能注释识别存在的主要病原体。针对无菌部位标本的宏基因组测序结果注释,Meta Phl An2数据库与传统的NCBI数据库一致性较好,可以作为后者的补充。
-
单位公共卫生安全教育部重点实验室; 上海交通大学