摘要
由于当前的敏感信息识别系统未考虑建立特定的敏感字仓库,容易导致不同文本中敏感信息识别精度低、识别效果差、漏报和误报数量大的问题,为此,设计了基于深度学习的非结构化敏感信息识别系统。这个系统采用以低功耗高通信速度为主要功能的DM9000网卡芯片,完成数据传送与接收工作,选取基于TMS320F28335的超声流量器,并应用于与网卡芯片连接的扩展网络端口部分,完成系统硬件设计。计算非结构化敏感信息语义结构和敏感词出现概率,利用深度学习建立敏感字仓库,设置真假判定函数,获取生成网络的最大值与最小值,得到权值属性维度,生成敏感信息识别算法,计算损失函数极小值,实现非结构化敏感信息识别。实验结果表明,在单字识别、词汇识别、短语识别、长句识别中,所提方法的敏感信息识别效果较好,识别漏报和误报数量较小,能够有效提高不同文本中敏感信息识别精度。
- 单位