基于数据用语智能分词技术的数据关联方法

作者:张新阳; 张梅; 马文; 程永新
来源:科技传播, 2018, 10(22): 121-123.
DOI:10.16607/j.cnki.1674-6708.2018.22.063

摘要

当前数据资产梳理以及数据标准建立过程中,对其中所遇到的数据命名不统一、中文语义复杂、难以建立数据关联等难点问题进行分析,提出了一套基于中文智能分词及大数据字符串分析技术的数据用语标准建立方法以及建立数据关联的方法。通过将该方法应用的数据资产管理项目中,实现了对某企业45套业务系统,10万多张表、70余万数据字段以及数百个业务接口的全自动梳理,建立了跨业务系统的数据标准体系和数据关联地图,为企业的数据资产进一步分析、挖掘、变现提供了有利支撑。

全文