摘要

鉴定群体的结构可以帮助追溯群体的发展史,定位疾病的易感基因.结构相关是一种常用的群体结构鉴定和关联作图方法.结构相关应用中的一个主要问题是它的统计效力高度依赖于所使用的祖代信息遗传标记.目前主要的祖代信息遗传标记选择方法大多要求已知研究样本的祖代信息,但是实际研究中个体的祖代信息大多未知或者难以确定.为了解决这个问题,本研究开发了一种新的基于主成分分析的祖代信息遗传标记选择算法.该方法不需要事先已知研究样本的祖代信息.模拟研究和真实的遗传数据分析提示,与传统的随机挑选祖代信息遗传标记的方法相比,新方法可以显著提高群体结构推断的准确性.本方法可以容易地应用于全基因组数据,挑选出富含群体结构信息的遗传标记.这些遗传标记可被广泛用于鉴定群体的结构和校正关联作图中群体混杂引起的统计偏差.