蒙古文日常问答语料数据集

作者:特日格勒呼; 王斯日古楞*; 韩永顺; 爱丽雅; 娜何雅
来源:中国科学数据(中英文网络版), 2022, 7(02): 66-74.

摘要

蒙古文自动问答研究发展缓慢,其中问答语料的稀缺是重要的原因之一。本研究通过对现有中文问答语料进行收集后通过规则筛选、汉蒙翻译、人工校正构建了5万对蒙古文问答语料。通过自动评价发现,该语料的问句和答复句具有较好的多样性,人工评价结果显示97%的语料符合日常问答逻辑。该语料范围主要是开放领域的日常对话,可应用在端到端的一问一答形式问答模型中,在蒙古文自动问答的研究中具有重要的使用价值。