基于神经耦合模型的异构词法数据转化和融合

作者:黄德朋; 李正华*; 龚晨; 张民
来源:北京大学学报(自然科学版), 2020, 56(01): 97-104.
DOI:10.13209/j.0479-8023.2019.098

摘要

为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数。将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列。在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能。