摘要
输变电工程造价数据源文件中存在大量图片,数据提取困难。基于此,提出图像预处理的图片文字识别方法,将B+树与索引技术相结合检索数据;对检索得到的关键造价数据进行数据元标准化、数据校验与数据集成,实现对关键造价数据在输变电工程造价数据收集模板前的管理,有效提高数据收集模板中关键造价数据的比对率。以某输变电工程数据为例进行关键造价数据的智能化提取,经数据校验后进行数据集成与融合,验证该方案的可行性。
-
单位国网上海市电力公司; 上海理工大学