摘要

对于目前基于机器学习开发的危害性预测软件在罕见错义突变上的预测效果评估。收集独立的测试数据集,数据集1和数据集2的致病突变与中性突变分别来源于ClinVar和UniProt数据库,两数据集间相互独立。同时下载了已报道明确致病位点的真实样本测序数据,评估不同软件在真实测序数据上致病突变的发现效果。结果表明不同软件对罕见错义突变危害性的预测效果不同,两份测试数据集的评估结果显示REVEL对错义突变的预测效果优于其他软件,但真实测序数据的评估提示在选择危害性预测软件时需综合考量权衡假阳性率与假阴性率。