摘要

目的比较潜在类别模型和主成分法在稀有变异遗传关联研究中的统计性能。方法利用GAW17数据库,通过集合策略将同一基因中的稀有变异合并成一个新变量,以基因为分析单位,分别运用潜在类别模型和主成分法构建常见变异和集合后稀有变异的分类潜变量或主成分,再应用线性回归模型分析基因对定量性状的整体效应,评价两种方法的I类错误和效能。结果潜在类别模型的I类错误(0.0400.085)均不高于主成分法(0.0400.190)。对强效应的稀有变异和常见变异,即使存在多个无关联稀有变异,潜在类别模型也能很好地分类且效能(1.000)不低于主成分法(0.9901.000);但稀有或常见变异效应弱时主成分法效能(0.635)高于潜在类别模型(0.200)。对多数非关联基因,潜在类别模型不收敛。结论和主成分法类似,潜在类别模型也可和稀有变异的集合策略结合,通过构建遗传变异数据的分类潜变量,进行稀有变异的遗传关联研究。分析定量性状时两法均可识别较强效应的稀有变异和常见变异。人群中遗传变异分布无异质性时,潜在类别模型常不收敛,提示遗传变异和性状无关联。