自然语言处理评测数据集质量评估研究

王诚文; 董青秀; 穗志方<sup>*</sup>; 詹卫东; 常宝宝; 王海涛

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

自然语言处理评测数据集质量评估研究

作者：王诚文; 董青秀; 穗志方^*; 詹卫东; 常宝宝; 王海涛

来源：中文信息学报, 2023, 37(02): 26-40.

摘要

评测数据集是评测任务的载体，评测数据集的质量对评测任务的开展和评测指标的应用有着根本性的影响，因此对评测数据集的质量进行评估有着必要性和迫切性。该文在调研公开使用的自然语言处理主流数据集基础上，分析和总结了数据集中存在的8类问题，并在参考人类考试及试卷质量评估的基础上，从信度、效度和难度出发，提出了数据集评估的相关指标和将计算性与操作性相结合的评估方法，旨在为自然语言处理评测数据集构造、选择和使用提供参考依据。

单位
北京大学; 中国标准化研究院

收藏分享被引浏览

更新时间：2024-03-19 02:54

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号