摘要
本发明公开一种PacBio测序数据纠错结果的自动化评估方法,对原始PacBio测序数据进行质量控制得到符合设定阈值范围的测序序列;使用待评估的纠错方法对质量控制后的clean reads纠错得到序列记为corrected reads,并统计纠错所需的内存资源和时间消耗;对纠错前、后的clean reads、corrected reads进行比较、分析,得到纠错输出率TH和纠错后序列的平均长度;将纠错后的corrected reads与其对应的参考基因组进行比对,得到比对序列MSA并统计分析,得到纠错的灵敏度和正确率;将纠错后的corrected reads组装得到contigs;将contigs与其对应的参考基因组比对,得到比对contigs MSA统计分析,统计出contigs的数量、基因组覆盖率和NGA50。
- 单位