摘要

[目的/意义]为充分挖掘大数据环境下政务数据中的情报价值,文章以海关报关商品自动归类研究为例,探讨经过长时间积累的大规模数据在数据自动处理和分析中的典型应用,从而有效体现数据的情报价值。[方法/过程]提取积累的政务数据中的报关商品及其类目的相关特征信息,进而采用深度学习方法对其进行建模和训练,最终利用机器学习获得情报,实现对未知类目报关商品的自动分类,达到风险规避的目的。[结果/结论]文章首先对不同的深度学习文本分类模型进行比较,在对得到的情报进行分析后,选择构建加入Attention机制的TextRNN模型。实验结果表明,该模型表现最优,能够较好的对海关报关商品进行归类,进而规避风险,并能更加充分挖掘海关报关数据中的情报价值。[局限]实验中对于报关商品特征的讨论有限,选取特征时仅参考了历史研究、专家意见与相关性值,其他有效特征可能被过滤,存在一定的局限性。