摘要
拷贝数变异是基因组变异的一种重要形式,在癌症基因组中普遍存在,其包括复发性和个体性拷贝数变异模式,前者指多样本中共同发生的拷贝数变异区域,后者指个体特异性拷贝数变异区域.本文针对个体性拷贝数变异的检测问题,提出一种基于分层矩阵能量谱的检测算法IndivCNV,其核心思想在于:通过全变分将观察到的信号进行平滑处理,利用潜变量模型将其重建为特征与权重的乘积,以检测拷贝数变异;然后对信号进行分层,依据分层矩阵能量谱在每层的占比,将个体性拷贝数变异进行鉴别.本文通过模拟数据测试所提方法的性能,并与三种同行方法进行比较,其结果表明所提方法的优势;同时,将方法应用于真实乳腺癌样本数据中,检测到一定数量的癌症关联基因.
- 单位