摘要
人类已经进入大数据时代,大数据研究的思想、方法在地学领域也备受关注。笔者认为,大数据研究的对象是数据,研究的工具是计算机,研究的方法、手段是查明数据间相关关系,研究的特点是取向高概率做出决策。大数据是通过对大量数据的挖掘,查明数据间的相关关系,研究问题并做出正确决策的思想、方法。本文提出大数据是应用"归纳法"开展科学研究的思想、方法,以及高性能计算机和大数据计算技术使"归纳法"得以升华的观点。文章通过对统计学、机器学习算法的深入探讨,得出大数据将改变人们对自然的理解和认知方式,改变科学研究的思想和方法,改变长期以来人们通过查找因果关系开展科学研究的习惯。大数据必将开创一条跨越复杂的因果关系、直接获得研究结果的全新的科学研究途径。随着数据爆发式增长,随着高性能计算机的普及和计算技术的迅猛发展,统计分析方法将很大程度地突破数据体量的限制,统计分析预测模型以其真实可靠的处理结果、对条件和结果良好的解释能力、结合机器学习算法对半结构化与非结构化数据的处理优势,将推动地质科学进入定量化研究的新高度。
- 单位