摘要

确定出生缺陷高危致病基因类型,推进遗传性疾病早期筛查和生育指导,对于先天性听力损失等出生缺陷的一级预防具有重要意义。本文采用通用数据挖掘工具,应用其决策树算法分析了近千例GJB2基因突变检测的临床数据,建立了听力出生缺陷的致病基因辅助筛查模型。通过研究模型树的结构和样本分类结果,发现模型树中有5组分支获得了纯净的听力损失阳性样本。此外,每个分支构成的基因位点的状态集合与临床研究证实的致病基因突变状态相一致。该决策树方法建立的筛查模型可以协助医生从临床大数据中快速筛选出致病基因的类型。