摘要

大数据背景下挖掘大规模高维数据所隐藏的信息备受关注.本文主要目的是采用分布式优化方法解决加SCAD和Adaptive LASSO惩罚的高维线性回归中的参数估计和变量选择问题.主要方法是通过构造全局损失函数的一个交互有效的正则化替代损失函数,把基于全局损失函数的优化问题转化为基于替代损失函数的优化问题.本文设计的修正的ADMM算法,在计算上,只需要子机器基于局部数据计算梯度,而主机器进行参数估计和变量选择.在主从机器交互复杂度上,基于替代损失函数所得的估计误差收敛于基于全局损失函数所得的估计误差.通过模拟和实证研究进一步验证本文提出的分布式计算方法在实际生活中的可行性和实用性.