基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法

孟先艳; 崔荣一; 赵亚慧; 方明洙

doi:10.19734/j.issn.1001-3695.2019.04.0132

摘要

针对日渐丰富的多语种文本数据,为了实现对同一类别体系下不同语种的文本分类,充分发挥多语种文本信息的价值,提出一种结合双向长短时记忆单元和卷积神经网络的多语种文本分类模型BiLSTM-CNN模型。针对每个语种,利用双向长短时记忆神经网络提取文本特征,并引入卷积神经网络进行特征优化,获得各语种更深层次的文本表示,最后将各语种的文本表示级联输入到softmax函数预测类别。在中英朝科技文献平行数据集上进行了实验验证,结果表明,该方法相比于基准方法分类正确率提高了4%,且对任一语种文本均能正确分类,具有良好的扩展性。

单位
延边大学

全文

访问全文

收藏分享被引浏览

更新时间：2020-11-17 05:22

基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友