摘要

使用因果推断相关的机器学习方法辅助检测致病基因时,作为因果推断的核心工具,条件独立性(CI)测试算法在高维生物数据场景中往往存在时间复杂度高以及准确性低等问题。为此,提出一种融合偏相关测试与线性残差独立性测试算法,压缩CI测试条件集的搜索空间,同时提高准确率。设计一种因果推断策略,在减少冗余CI测试的同时结合V结构与因果函数模型的优点,在应用于真实癌症数据的致病基因检测场景中可以区分Markov等价类,找到真正的因果关系。实验结果表明,提出的算法有较好的致病基因检测性能。

全文