摘要

岩石与矿物的地球化学成分数据具有高维度特征。传统的岩矿地球化学成分研究主要采用二元/三元图解判别法,准确率不高,在数理统计方法上有欠缺。机器学习方法非常适用于对大样本高维度的岩矿成分数据进行数理统计处理。笔者等在介绍机器学习常见算法基本原理的基础上,总结近5年来国内外学者将机器学习方法应用于岩石矿物成分数据研究的实例,包括:(1)根据矿物成分溯源其母岩(源岩)、判别矿床类型,(2)新生代火山岩溯源,(3)判别变质岩原岩,(4)依据岩浆岩成分判别大地构造环境等。已有的研究实例显示,机器学习方法的准确度明显优于传统的低维度判别法。机器学习本质是分析大样本数据的高维度变量之间的相关、归类等多元统计问题。推广机器学习的应用需要建设开放获取(Open Access)的矿物、岩石成分数据库,同时全面实施开放研究(Open Research)的发表策略。