高维数据下的贝叶斯网络结构学习

作者:杨雨萌; 黄琼华; 汪四水*
来源:数理统计与管理, 2019, 38(06): 1014-1025.
DOI:10.13860/j.cnki.sltj.20191011-003

摘要

贝叶斯网络模型作为一种传统有效的大数据图模型,因其具有因果和概率性语义等特点受到学者们的广泛研究。为了解决基于高维数据构建贝叶斯网络的难题,本文提出了一种适用于高维数据的贝叶斯网络结构学习算法—LTB算法,该算法由Lasso、Tabu Search算法和BIC结合。首先,运用Lasso降低协变量的维数,筛选出与目标变量关系密切的协变量将作为贝叶斯网络的顶点。然后,选择Tabu Search作为元启发式算法,选择BIC作为计算得分的方法,两者结合构建全局最优的贝叶斯网络结构。实证分析表明,LTB算法应用于上证综指影响因素的研究,既可以获得上证综指与其影响因素间的因果关系,也可以利用条件概率得到上证综指影响因素间的组合方式。

全文