融合双通道音节特征的藏文La格例句自动分类模型

作者:班玛宝; 才让加*; 张瑞; 色差甲; 卓玛扎西
来源:北京大学学报(自然科学版), 2022, 58(01): 91-98.
DOI:10.13209/j.0479-8023.2021.106

摘要

基于藏文La格()例句的自动分类在藏语自然语言处理领域的重要性,根据藏文La格的用法和添接规则,在对藏文La格例句进行分类并定义分类概念的基础上,提出一种融合双通道音节特征的藏文La格例句自动分类模型。该模型首先使用word2vec和Glove构建双通道藏文音节嵌入,分别在每路卷积中融合双通道音节特征,丰富输入特征的表达和提高卷积层的空间表征能力;然后在每一路卷积均使用结合层级注意力机制的Bi-LSTM学习时序特征后,拼接多路特征,提高上下文时序特征的学习能力;最后通过全链接层和Softmax层实现藏文La格例句自动分类。实验结果表明,该模型在测试集上的藏文La格例句分类准确率达到90.26%。

全文