维吾尔语形态切分的元学习方法

作者:张雨宁; 李文卓; 哈里旦木·阿布都克里木; 阿布都克力木·阿布力孜
来源:计算机工程与应用, 2022, 1-8.

摘要

随着深度学习的发展,维吾尔语形态切分的准确率得到了大幅提升,但对数据量的需求较高,而元学习方法通过对以往任务的学习,有效缓解了模型对数据量的依赖,在低资源领域应用广泛。因此提出维吾尔语形态切分的元学习方法,该方法主要通过对以往任务的训练,获得一组具有快速适应新任务能力的参数,从而在新任务上实现快速泛化。实验首先根据数据的相似度构建N个伪元学习任务,完成元学习支撑集和查询集的划分,之后使用Transformer的编码器对维吾尔语数据进行编码,最后采用元学习方法实现对少样本环境下的维吾尔语形态切分。实验结果表明,在维吾尔语形态切分的少样本任务中元学习方法优于预训练模型,有效避免了模型的过拟合,缓解了数据稀疏性对模型的影响。

  • 单位
    新疆财经大学