基于最简门单元的循环神经网络分词

作者:刘志明; 孙严伟*; 欧阳纯萍; 万亚平
来源:计算机工程与设计, 2019, 40(05): 1328-1333.
DOI:10.16208/j.issn1000-7024.2019.05.024

摘要

为解决长短期记忆(long short-term memory,LSTM)单元循环神经网络结构复杂,训练时间长,标注推理速度慢的问题,结合现有文献分析循环神经网络及其单元结构的理论基础,提出一种基于最简门单元(minimalist gated unit,MGU)的循环神经网络进行中文分词研究。使用MGU单元替换LSTM单元自动提取特征,建立长期依赖信息。在中文分词评测常用语料Bakeoff 2005数据集上进行实验,实验结果表明,MGU网络与LSTM网络精度相当,训练时间减少一半,标注推理速度可提升至3倍。

全文