摘要

区域地质灾害易发性评价样本数据的可靠性是影响最终评价结果的关键因素之一。以陕西省白河县236处地质灾害为研究对象,分别采用层次聚类算法与动态K-means聚类算法对地质灾害样本数据进行聚类分析并获得其样本纯度。分析结果表明:层次聚类算法与K-means聚类算法得到样本纯度分别为91.53%与92.80%;结合两种算法结果,剔除样本噪声点20个,确定有效样本点216个,得到最终样本纯度为91.53%。利用样本提纯前后数据分别建立信息量模型(Ⅳ前、Ⅳ后),开展区域地质灾害易发性评价。评价结果表明:Ⅳ前模型与Ⅳ后模型得到的区域易发性区划图中,地质灾害落入极高-高易发区的数量分别为149个与167个,分别占灾害总数的63.13%与70.77%,灾害密度分别为0.508个/km2与0.584个/km2,较初始样本条件,样本提纯后极高-高易发区内灾害点数增加18个,灾害密度增加0.076个/km2,地质灾害分布更集中,预测结果准确度更高。研究结果可为地质灾害易发性评价研究中的初始样本数据提纯提供一定的理论与科学依据。