摘要

为探索癌症潜在分子机制、研发高效癌症疗法,建立一种搜索癌症驱动基因集的优化模型。提出将覆盖性、互斥性与基因表达水平相结合,构建最大权重子矩阵模型以识别驱动基因集,称为基于表达协变量的驱动基因集搜索算法(Exp DS)。最大权重子矩阵的求解是一个NP问题,使用遗传算法进行目标函数优化。应用Exp DS方法进行肺腺癌(TSP,Nature 2008)驱动基因集的搜索,结果表明Exp DS较其他几种同类算法能更有效识别出重要细胞信号通路中涉及的基因,这些基因具有高权重、高覆盖性及显著互斥性。