面向语言文学领域的大语言模型性能评测研究

赵雪; 赵志枭; 孙凤兰; 王东波<sup>*</sup>

doi:10.20139/j.issn.1001-5795.20230610

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

面向语言文学领域的大语言模型性能评测研究

作者：赵雪; 赵志枭; 孙凤兰; 王东波^*

来源：外语电化教学, 2023, (06): 57-114.

DOI：10.20139/j.issn.1001-5795.20230610

摘要

该研究选取16个热门大语言模型，探究其在5个典型语言处理任务上的表现，最后对参测模型进行综合评价。研究发现，闭源大模型GPT-4和GPT-3.5-Turbo综合表现最佳，开源大模型中Baichuan2-7B-Chat表现突出,Qwen-7B-Chat次之,ChatGLM2-6B和ChatGLM-6B合格。模型的领域生成能力差异巨大，该研究旨在为语言文学研究者提供模型的选择建议，促进语言文学研究与人工智能的交叉融合。

单位
北京外国语大学; 南京农业大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-18 11:34

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号