摘要
针对在数据治理过程中数据纠错成本高、效率低、易出错、纠错经验少等各种问题,提出了基于增强型血缘图和DP算法的数据治理方法。方法优化了元数据血缘图数据存储方式,引入BFS算法对需要纠错的数据节点进行动态权重配置,引入DP算法对需要纠错的数据节点进行动态资源规划和资源调配,建立“纠错知识库”,进行经验共享、智能纠错和一键纠错。方法运行效率高,可以充分节约现有机器资源和人力资源,实现数据纠错的全面化和精确化,提升了数据治理效果。
- 单位
针对在数据治理过程中数据纠错成本高、效率低、易出错、纠错经验少等各种问题,提出了基于增强型血缘图和DP算法的数据治理方法。方法优化了元数据血缘图数据存储方式,引入BFS算法对需要纠错的数据节点进行动态权重配置,引入DP算法对需要纠错的数据节点进行动态资源规划和资源调配,建立“纠错知识库”,进行经验共享、智能纠错和一键纠错。方法运行效率高,可以充分节约现有机器资源和人力资源,实现数据纠错的全面化和精确化,提升了数据治理效果。