摘要

传统机器学习分词的方法工作效率普遍偏低,因其基本依赖于人工设计的特征工程,且需要大量的人工验证特征的有效性。而基于神经网络深度学习算法出现后,实现了训练神经网络自动学习特征,这种方式极大减少工作量,同时提高提取特征工程的效率。本文根据一种基于长短时记忆神经网络与条件随机场模型结合的中文自动分词模型进行测试,结果表明分词准确率、召回率极高,更具通用性。

  • 单位
    吉林广播电视大学; 吉林建筑大学城建学院