摘要
本发明公开了一种基于解耦法律要素的法律文本表示方法,包括法律要素定义和标注、数据构建、模型训练和下游任务具体应用等步骤,将法律要素领域知识与深度学习模型相结合。对于包含某法律要素的文本,本发明提出借助于一个包含该法律要素的正样本和一个不包含该法律要素的负样本构建三元组,基于triplet loss学习法律文本关于该法律要素的向量表示。对于多个法律要素,本发明为每个法律要素构建三元组并训练相应的模型,不同法律要素间的模型训练相互独立,互不影响。本发明方法可以较好捕捉到法律要素间的细微差别,同时减少其他无关信息的影响,为法律领域文本表示提供了一个新的解决方案。
- 单位