摘要
随着深度学习的发展,维吾尔语形态切分的准确率得到了大幅提升,但对数据量的需求较高,而元学习方法通过对以往任务的学习,有效缓解了模型对数据量的依赖,在低资源领域应用广泛。因此提出维吾尔语形态切分的元学习方法,该方法主要通过对以往任务的训练,获得一组具有快速适应新任务能力的参数,从而在新任务上实现快速泛化。实验首先根据数据的相似度构建N个伪元学习任务,完成元学习支撑集和查询集的划分,之后使用Transformer的编码器对维吾尔语数据进行编码,最后采用元学习方法实现对少样本环境下的维吾尔语形态切分。实验结果表明,在维吾尔语形态切分的少样本任务中元学习方法优于预训练模型,有效避免了模型的过拟合,缓解了数据稀疏性对模型的影响。
-
单位新疆财经大学