摘要
由于污染源受地形、地貌及气象等条件影响而分布多样,大气污染数据在空间中呈任意形状、任意密度的复杂分布。为探究这种大气污染分布状况,基于DP算法提出了1个发现污染类核心区域的聚类模型。以实现对污染数据不经统计直接聚类,在保持空气污染数据分布特征不变的基础上提取出关键污染数据,更准确地挖掘空气污染变化规律。将所提聚类模型和k-Means算法在由兰州市2017,2019,2021年各年1月污染物浓度小时数据构成的3个数据集上进行了对比分析。结果显示:所提模型在以上3个数据集上均能更清晰地挖掘出污染数据,在污染类核心区域中的关键污染数据分别为59.0%、57.2%和69.0%,且造成污染的首要污染物均为NO2和颗粒物。此外,该模型从兰州市2021年1月数据中解析出,兰州市月污染变化由污染物NO2和PM10共同作用或交替作用引起,日污染变化在受污染小时数和首要污染物(NO2和PM10)出现次数上的变化趋势均呈双峰型,污染区域为城关区。并通过分析上述污染规律的成因,证明该模型在确保数据复杂分布不变的情况下提取关键污染数据的有效性。
- 单位