摘要
中文在线教育评论情感识别在很大程度上受到有标注数据不足的限制,针对此问题,基于806门中国大学MOOC以自动和人工相结合的方式构建中文慕课情感识别语料库,共计10 340条评论,其中褒义5 411条,贬义4 929条,保证了语料库的平衡性和学科覆盖的广泛性。制定语料收集和预处理策略、标注规范、标注体系、一致性检测方法;提出了神经网络模型以及基于大规模预训练语言模型的情感识别方法;实现了情感识别结果面向教学管理部门、教师2种使用角色的应用。该语料库为面向在线教育评论的情感分析研究奠定数据基础,对赋能教学评价、助力智能教学系统具有重要意义。
-
单位大连外国语大学