基于线性分析的日语文本分类模型构建研究

毛文伟

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于线性分析的日语文本分类模型构建研究

作者：毛文伟

来源：外语电化教学, 2019, (06): 97-112.

摘要

本文以涵盖日常会话、会议发言、小说、议论文、政府白皮书以及新闻报道等多个类型的训练组文本为对象,统计其名词比、数词比、接续词句比等22项数据,将其作为文本表示方式进行线性分析,从中选取14项具有显著判别能力的指标,确定了其权重,由此构建基于Bayes分类函数的文本分类模型。观察这14项典型指标可知,除词汇占比类数据外,句长等指标也能够成为文本分类的有效依据。经测试,在绝大多数情况下,该模型的分类准确率都高于85%,召回率都高于81%,实现了以较小的运算量达到较高分类精度的目标。

单位
上海外国语大学

收藏分享被引(5) 浏览

更新时间：2024-04-09 21:35

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号