摘要

随着数字化智能技术的发展,信息泛滥、算力膨胀、数据异构性及混杂性等问题频现,给数据建模的理论方法带来极大挑战.本文从众数角度出发,提出最优分位水平概念和加权最优分位回归(mode based weighted quantile regression, MWQR)方法,以求最大程度利用样本信息.与已有估计方法相比,MWQR方法具有如下优势:(1)适用于复杂高维异质性数据,在误差分布厚尾和偏态时仍能保证稳健性;(2)解决了分位回归建模中分位水平主观选择的问题;(3)通过赋予不同分位水平不同权重,极大提升估计效率,减少运算时间;(4)有效探测响应变量的条件分布.鉴于MWQR方法的优势,本文进一步将其应用于部分线性可加模型,提出两种算法进行变量选择和系数估计,并探究理论性质.数值模拟及城投债“隐性担保”和血浆β-胡萝卜素浓度两组实际数据分析,表明该方法能很好地挖掘数据内蕴结构,显著提高运算效率,具有广泛的应用价值.