摘要

本文通过语义分析、关键字识别、正则表达式匹配及组合识别等多种技术,对数据敏感度进行了分类分级的自动识别。并应用在实际生产中,对1777个数据库实例进行了识别。通过线程控制解决了海量数据库同时识别问题,通过语义分析解决了姓名、地址等无特征内容的识别问题。

  • 单位
    中国电信股份有限公司