摘要

为了提升数字化法律文书知识库的建设效率,文中提出了基于深度学习理论的法律文书识别方法。该方法基于长短期记忆(LSTM)网元结构构建深度神经网络,引入遗忘门进行网元的状态更新,使用Softmax函数作为非线性传播函数,实现自然语言中的实体识别。经测试,该方法可以有效的提取法律文书中的当事人姓名、案由和审判机构等;在文中所采用的测试集上,相较于CRFs算法,该方法在准确率、召回率和F上均可以取得约10%的提升。

  • 单位
    扬州大学广陵学院