摘要
目的 利用异常识别算法识别出原数据集中存在的奇异点,以建立预测精度更高的酒醅定量分析模型。方法 采用集群分析思维,利用马氏距离、主成分马氏距离、蒙特卡罗交叉验证法对108个样本进行异常样品识别及剔除,以光谱-理化值共生距离算法进行样品集的划分,划分比例为3:1。结果 酒醅水分近红外定量分析模型经马氏距离处理后预测精度达到最高,预测相关系数上升了0.43%,预测均方根误差下降了6.94%;酒醅酸度近红外定量分析模型经马氏距离处理后预测精度达到最高,预测相关系数上升了0.02%,预测均方根误差下降了0.20%;酒醅还原糖近红外定量分析模型经蒙特卡罗处理后,预测相关系数上升了8.74%,预测均方根误差下降了42.14%;酒醅淀粉近红外定量分析模型经蒙特卡罗处理后预测精度达到最高,预测相关系数上升了2.81%,预测均方根误差下降了57.80%。结论 经过验证,剔除异常样品可建立出预测精度更高的酒醅定量分析模型。
-
单位西南科技大学; 四川轻化工大学