摘要
为了提高跨境旅游汉译英的翻译质量,制定规则模板识别非信息句,构建基于分类器的非信息句识别模型,并在此基础上构建融合集成学习的半监督非信息句识别模型。实验结果表明,当训练集比例为1∶1时,特征维度为50维时,三种分类器具有最好的分类效果;其中,引入集成学习的半监督方法分类效果最高;其在最大熵(Maximum Entropy, ME)分类器下,G-mean值最高,达到0.866,基于统计机器翻译(Statistical Machine Translation, SMT)的翻译系统英语成文率和翻译准确率及性能均优于Google在线系统,说明该系统能够促进跨境旅游翻译质量的提升。
- 单位