摘要

气象纸质表格历史资料有很高的科学研究价值和很重要的历史保留意义。数字档案通过数字化的方式将纸质原始资料进行收集、保存和提供各类数字信息资源。本文提出了一种“纸质表格扫描成像”+“图像碎片化处理”+“众筹识别”的快速数字化方法及系统,利用气象大数据资源,应用DBnet模型、DSCC算法等技术对纸质气象表格扫描图像进行图像碎片处理;通过用户的登录行为实现“众筹录入”,完成气象纸质表格资料的数字化档案工作。经验证,快速数字化系统的一录正确率约为99.7%,高于传统数字化人工键入的一录正确率(95.6%);录入时效比传统数字化提高了22.2%。该系统保证了数据正确性、提高了工作效率,实现了气象纸质表格资料快速形成数字档案的目标,也为数字档案工作提供了新的思路;在新冠疫情导致传统数字化人工聚集工作模式面临较大风险的背景下,具有一定的现实意义。

  • 单位
    中国气象局公共气象服务中心; 北京应用气象研究所; 清华大学; 国家气象信息中心

全文