摘要

本发明属于基因序列数据检测技术领域,公开了一种基于高通量测序数据的微生物成分及浓度检测方法;量化碱基匹配或错配指示度、比对产生的gap与特定可变区指示度信息,建立基于NGS数据的读段-物种库的隶属关系体系,通过设置隶属分数阈值过滤掉潜在的干扰读段,为准确鉴定与估计样本中物种成分与浓度奠定基础;提取物种的覆盖率、比对的gap得分、可变区得分三个特征,使用机器学习方法进行样本中物种成分的鉴定,提高物种成分鉴定的准确度。本发明基于高通量测序数据,研究病变样本中的微生物成分与浓度,脱离了以微生物培养为核心的传统临床检测手段,实现了速度快、准确率高的临床致病菌检测。