摘要
基于国家海洋信息中心质量控制后的西太平洋10度方区约100万站次温盐实测历史调查资料,对经过26种严格质量控制方法的综合海温质量符进行分类分析,首次将深度学习技术应用于海洋数据质量控制多分类(multiclass classification)算法与应用研究。通过人工合成少数类样本和加权损失函数方法减少多数类的频率来降低数据的不平衡,并构建了多层感知器(Multi-Layer Perceptron, MLP)和深度神经网络(Deep Neural Network, DNN)两个海温资料质量符分类深度学习模型。分类结果表明本文构建的两个深度分类模型能够较准确快速地识别该海域海温数据质量,在20 975条温盐剖面资料测试集中分类准确率分别达到99.63%和99.69%。海温资料的分类精度评分有着较好的表现,其中正确数据(QC1)和数据缺失(QC9)的正确识别率均达100%。MLP和DNN多分类质量控制模型可大幅降低传统质量控制方法的工作量,提升海量数据处理速度和分析能力,为海温观测资料在海洋研究与工程中应用提供参考。
-
单位国家海洋信息中心; 天津市滨海新区气象局