数据驱动型研究方法在矿物学领域里的新发现——矿物数据资源、数据分析和可视化的最新研究进展OA

作者:Robert M.Hazen*; Robert T.Downs; Ahmed Eleish; Peter Fox; Olivier C.Gagné; Joshua J.Golden; Edward S.Grew; Daniel R.Hummer; Grethe Hystad; Sergey V.Krivovichev; Congrui Li; Chao Liu; Xiaogang Ma; Shaunna M.Morrison; Feifei Pan; Alexander J.Pires; Anirudh Prabhu; Jolyon Ralph; Simone E.Runyon; Hao Zhong
来源:Engineering, 2019, 5(03): 104-122.

摘要

随着矿物种类多样性、矿物(时空)分布特征和矿物性质等领域海量数据的快速增长,矿物学迎来了数据驱动型研究发现的新纪元。当前,最全面的国际性矿物数据库是IMA数据库和mindat.org数据库,其中,IMA数据库包含了超过5300种被国际矿物学协会(International Mineralogical Association,IMA)批准认可的矿物及其属性信息。此外,mindat.org数据库包含了超过100万种矿物种类及其产地信息,这些矿物来自于世界各地,有登记在册的产地来源就超过了30万个。采用各种现代化分析方法对这些海量地学数据进行分析解读和可视化处理,进一步增进了对地球圈和生物圈协同演化过程的理解认识,这些分析方法包括chord图、cluster图、Klee图、skyline图,以及各式各样的网络分析方法。新型数据驱动型分析策略包括矿物演化分析、矿物生态学分析和矿物网络分析,这些分析策略能够系统性地综合考虑矿物的时空分布特征及其多样性。这些分析策略正在增进对矿物共生现象的深入认识,并且首次推动了对"地球上存在但尚未被发现和记录在册矿物"的预测。