摘要

本文采用目前世界上使用广泛的GEOCOR数据库对地质矿物进行数据挖掘。首先利用Python和Matlab等工具对全球矿物的地球化学数据集(41360件)进行预处理(数据清洗),然后对特征数据集进行空间分布、聚类分析和社区发现的可视化分析,最后利用二次清洗得到的建模数据,采用ELM和SVM两种机器学习方法对地质矿物构造背景进行智能预测判别,得出以下重要结论 :(1)通过对地质矿物的28个属性进行K-Means聚类得到的雷达图,结合学术界的研究得出,地质矿物的聚类可视化效果比较明显。(2)通过社区发现算法来挖掘新的构造背景与原有的七个构造背景间的潜在联系,每一个构造背景为一个节点,都可以进行系统地探索。运用逆向推导的思维可以推断出地球化学元素与地质矿物原有的七种构造背景间存在的特定联系,如类别3的矿物的主量元素MgO、微量元素Cr、Ni与类别6的主量元素K2O、微量元素Th、Nb、Rb在原有大陆溢泥质矿物构造背景上可以明显区分于其它构造背景。(3)本文采用大数据思维,在建模数据有限的情况下,利用支持向量机对地质矿物的六种构造背景进行预测判别,识别准确度高达91.7%。充分说明利用支持向量机对矿物的构造背景进行预测判别是可行的。