摘要
目的 探索拷贝数变异(CNA)区域中的非中性选择,分析肿瘤基因组中CNA与基因密度之间的关系。方法 从ArrayMap公共数据库中收集注释过的肿瘤基因组数据,对来自16 264个癌症样本,代表62个肿瘤类型的体细胞CNA进行分析,使用Spearman相关系数评估小片段拷贝数丢失和染色体断点与基因富集区的相关性。结果 从基因数量和编码序列占比方面来看,在基因密集的区域中,小片段的CNA显著富集,Spearman相关系数R=0.342,P<0.001。与CNA相关的DNA断裂位点也与富含基因的区域呈正相关,平均Spearman相关系数R=0.460,P<0.001。相反,染色体臂级CNA的频率与各个染色体臂上的总基因数呈负相关,Spearman相关系数R=-0.449,P=0.004,并且在各种肿瘤类型的数据中均观察到类似的结果。结论 通过大数据得到的肿瘤基因组图谱揭示了小片段CNA与基因密度之间存在正相关,而染色体臂级的CNA与其基因数则呈现负相关性。这些结果体现了CNA在肿瘤基因组进化过程中的非中性选择。
- 单位