基于Stacking多算法融合模型的数据资源定价方法训练流程如下

沈俊鑫; 赵雪杉

doi:10.16353/j.cnki.1000-7490.2023.01.021

摘要

[目的/意义]针对现有数据资源定价标准模糊、交易规则缺失、买卖双方信息不对称的问题，提出基于Stacking多算法融合模型的数据资源定价方法。[方法/过程]首先，基于四分位法及Box-Cox方法对样本数据进行预处理，剔除异常数据的同时调整数据分布，并基于Lasso算法以均方根误差最小为目标完成特征筛选；其次，基于Pearson系数选取最优算法组合，构建基于Stacking集成学习融合多种机器学习算法的数据资源价格预测模型；最后，以国信优易数据平台交易数据为样本进行算例分析。[结果/结论]相较于单算法模型及其他集成算法模型，XGBoost、SVR、KNN、MLP融合模型的预测精度及性能均明显提升；实现了数据资源自身和市场的双向反馈平衡，形成闭环的价值链，为数据资源定价提供参考。

单位
昆明理工大学

全文

访问全文

收藏分享被引(5) 浏览

更新时间：2024-03-15 16:07

基于Stacking多算法融合模型的数据资源定价方法训练流程如下

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友