摘要

<正>拷贝数变异(copy number variation,CNV)是一种基因组的某些部分序列片段被重复,且重复序列片段数量在不同生物个体之间有所不同的现象[1]。拷贝数变异是一种结构性变异,具体而言,其是一种影响基因组中相当数量碱基对的复制或删除事件。整个人类基因组约有三分之二可能由重复片段组成,人类基因组的4.8%~9.5%可归类为拷贝数变异[2]。在哺乳动物中,拷贝数变异在产生种群的必要变异以及疾病表型方面起着重要作用,是生物重要的进化机制之-[1]。然而,人类中的CNVs赋予适应性优势的例子很少。相反,人类的大多数大的CNVs在全球人口中被强大的净化选择(purifying selection)压力使其保持在低频率上[3]。近些年来,随着患病个体和普通健康人群中深度的基因型和详细的临床数据可以不间断高通量获得,使得研究人员能够以前所未有的统计分析手段进行基因和表型的关联研究。这种丰富关联信息对研究罕见的拷贝数变异(rCNVs,<1%的人口频率)尤其重要。这些罕见的拷贝数变异包含数千个潜在剂量敏感基因的基因组区域的删除和重复。有研究显示,15%~25%被诊断为神经系统和发育障碍的个体在其基因组中携带rCNVs[4-5]。