摘要

为了强化案件语义信息以及法条间的联系,提升多法条自动推送效果,将法条司法解释加入模型训练中,提出了一种基于XLCLS融合法律解释和相似性XLNET-CNN模型的法条多标签分类方法。该方法首先利用数据增强对案件进行扩充预处理;引入XLNET模型提升案件的向量化表征能力,再加入法条司法解释加强案件语义信息;然后通过CNN模型获取特征信息,进而利用法条间相关性来解决罕见法条容易被忽略的问题,并结合sigmoid函数计算各法条概率;最后通过阈值的选取来实现法条多标签分类。实验结果表明,在公益诉讼案件数据上,该方法的F1,ma与F1,mi上分别达到了88.37%与89.92%,验证了所提方法的可行性与有效性。