摘要
目的 开发一种基于临床表型的致病基因排序方法,提高致病基因检出的准确性。方法 基于人类表型本体(human phenotype ontology, HPO)所生成的有向无环图中的拓扑信息,计算给定表型组与疾病表型间的相似度,建立致病基因排序新方法;利用3 075例模拟数据和385例已确定致病基因的外显子测序数据,分别进行模拟分析和效果验证。结果 对比新方法与5种已有方法的结果显示,在无噪声数据和不准确数据的模拟数据集中,新方法性能与3种已有方法差异无统计学意义。在有噪声数据的模拟数据集中,新方法具有较高的敏感性,其对应疾病排名在候选列表第一、前五、前十、前二十位的百分比分别为19.31%、37.85%、47.90%、58.04%,均显著高于4种已有方法;在真实外显子测序数据中,新方法的对应致病基因排名在候选列表第一、前五、前十、前二十位的百分比分别为41.56%、51.43%、58.18%、64.68%,其敏感性高于其他方法(P<0.001)。结论 建立了一种基于临床表型的致病基因排序方法,该方法具有较高的敏感性,有望提高外显子检测中致病基因筛查的准确性。