摘要

变量筛选是现代工业过程产品质量预测研究中的热点问题之一。过滤式变量选择方法因其计算速度快且不易造成过拟合得到了广泛应用,但其存在容易忽略变量相关性且不能准确反映工况信息的问题,在高维数据维度灾难问题日渐突出的当今不再适用。针对这一问题,提出一种分步约简的敏感变量选择方法。该方法在明确敏感变量和关键敏感变量的基础上,根据变量对工况的描述能力和辅助变量与主导变量的净相关性定义了敏感性指标,实现敏感变量的初选;接着,构建加权余弦马田系统以解决变量冗余性问题,实现敏感变量的精选。所提方法应用于加氢裂化产品质量预测,实际工业应用结果表明,该方法不仅可以提高模型的预测精度,而且可以有效地降低模型复杂性。