摘要

地球大数据使人们以前所未有的维度和规模认识赖以生存的地球,而挖掘隐藏在数据背后的因果关联是深入理解地球系统的关键.长期以来,以相关为内核的统计方法都是地球系统科学研究的主流方法,但相关并不等于因果,特别是大数据导致“伪相关”的泛滥,传统的相关和回归方法难以解释地球系统因果相关问题.随着因果理论和推理方法的完善,特别是近年来因果发现和因果图模型的成熟,因果推理在地球系统规律揭示、过程理解、假设检验和模型改进等多个研究方向展现出蓬勃的生命力.文章从因果关系的起源、内涵和发展入手,概述了因果推理的主要研究框架和地球系统科学领域常用的因果推理方法,回顾了因果推理在地球系统主要分支领域的应用,探讨了地球系统科学领域因果推理实践面临的挑战和发展方向.在地球大数据背景下,作为重要的大数据分析方法,因果推理与物理模型和机器学习的互惠能够助力地球系统科学实现从模型驱动到机理与数据融合驱动研究范式的转换.展望未来,结构化、规范化的因果理论能够为地球系统科学的因果认知筑基,推动地球系统科学从单一领域的分散研究到地球系统综合理解的认识跃迁.