摘要

肿瘤组织的高度异质性是癌症基因组学研究的一个重要课题.在临床实验中获得的肿瘤样本的甲基化谱通常是来自不同成分的混合信号,如癌细胞(cancer cells)、正常细胞(normal cells)、基质(stromal)和免疫浸润细胞(immune cells).其中正常细胞的混合被认为是许多下游分析的主要混淆因素,忽视或不恰当地考虑肿瘤纯度可能会导致DNA甲基化分析出现偏差或错误的结果,因此建立合适的统计模型修正肿瘤纯度至关重要.文章开发了一个线性统计模型InfiniumPurifyMT,基于肿瘤样本、邻近正常样本和肿瘤纯度得到纯化的肿瘤甲基化谱.