摘要

在组学和大数据时代,整合分析材料相同但时间、平台、方法、技术和实验室等不同批次的表达数据集将成为常态。但是,不同批次数据集由于非生物因素影响会产生批次效应,这种批次效应可能会对试验结果产生严重影响,甚至导致错误结论。本文介绍了几种去除基因表达数据批次效应的方法,包括ComBat方法、替代变量分析法、距离加权判别法和基于比值的方法等。通过前人研究和实例分析表明,ComBat方法是最好的去除基因表达谱数据集批次效应的方法。这些结果将为多批次表达数据集的整合分析提供参考依据。