基于Transformer增强架构的中文语法纠错方法

王辰成; 杨麟儿<sup>*</sup>; 王莹莹; 杜永萍; 杨尔弘

摘要

语法纠错任务是自然语言处理领域的一项重要任务,近年来受到了学术界广泛关注。该任务旨在自动识别并纠正文本中所包含的语法、拼写以及语序错误等。该文将语法纠错任务看作是翻译任务,即将带有错误表达的文本翻译成正确的文本,采用基于多头注意力机制的Transformer模型作为纠错模型,并提出了一种动态残差结构,动态结合不同神经模块的输出来增强模型捕获语义信息的能力。受限于目前训练语料不足的情况,该文提出了一种数据增强方法,通过对单语语料的腐化从而生成更多的纠错数据,进一步提高模型的性能。实验结果表明,该文所提出的基于动态残差的模型增强以及腐化语料的数据增强方法对纠错性能有着较大的提升,在NLPCC 2018中文语法纠错共享评测数据上达到了最优性能。

单位
北京语言大学; 北京工业大学

收藏分享被引浏览

更新时间：2024-04-13 10:17

基于Transformer增强架构的中文语法纠错方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友