基于改进K-means的大气污染物高维度信息研究

黄乐成; 陈超; 韩存鑫; 赵彬

doi:10.19927/j.cnki.syyt.2022.09.028

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于改进K-means的大气污染物高维度信息研究

作者：黄乐成; 陈超; 韩存鑫; 赵彬

来源：实验室研究与探索, 2022, 41(09): 135-139.

DOI：10.19927/j.cnki.syyt.2022.09.028

摘要

对中国2013～2018年高分辨率大气污染分析开放数据集采用传统数据挖掘方法时，面临数据量大、挖掘效率低等难题，改用基于SparkK-means的聚类方法对大气污染物海量信息进行研究。以6种常见大气污染物和5种环境影响因子为例，建立了Pm2.5、Pm10、SO2、NO2、CO、O3和Temp等数据维度模型。对K-means算法选择初始聚类数K值时，利用Gap Statistic算法相比传统K-means算法利用SSE算法确定K值，Gap Statistic算法在高维度样本数据模型中确定K值更合理且直观。

单位
四川轻化工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 23:28

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号