维吾尔语形态切分的元学习方法

张雨宁; 李文卓; 哈里旦木·阿布都克里木; 阿布都克力木·阿布力孜

摘要

随着深度学习的发展，维吾尔语形态切分的准确率得到了大幅提升，但对数据量的需求较高，而元学习方法通过对以往任务的学习，有效缓解了模型对数据量的依赖，在低资源领域应用广泛。因此提出维吾尔语形态切分的元学习方法，该方法主要通过对以往任务的训练，获得一组具有快速适应新任务能力的参数，从而在新任务上实现快速泛化。实验首先根据数据的相似度构建N个伪元学习任务，完成元学习支撑集和查询集的划分，之后使用Transformer的编码器对维吾尔语数据进行编码，最后采用元学习方法实现对少样本环境下的维吾尔语形态切分。实验结果表明，在维吾尔语形态切分的少样本任务中元学习方法优于预训练模型，有效避免了模型的过拟合，缓解了数据稀疏性对模型的影响。

单位
新疆财经大学

收藏分享被引浏览

更新时间：2023-02-11 16:13

维吾尔语形态切分的元学习方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友