摘要

从与复杂疾病相关的基因上的单核苷酸多态性(SNPs)数据出发构建网络,可有效挖掘SNPs间相关性,进而实现疾病相关SNPs的定位。传统的相关性系数仅能度量SNPs间的线性关系,互信息可发掘非线性关系,但存在有偏估计,导致推断出的SNP网络错误率较高。因此,论文基于条件互信息(CMI)及最佳的CMI阈值,对彼此间CMI值大于阈值的SNPs进行连边,建立病例组和对照组SNP-SNP相互作用网络,并分析网络中节点拓扑特征属性,最终筛选出可能的致病SNPs。实验结果表明:论文方法能够快速准确地得到致病SNPs集合。