基于SentencePiece的中医学分词模型建模研究

刘双巧; 周璐; 李彩艳; 袁慧敏; 张异卓; 李昱达; 刘锦钢; 郑丰杰; 孙燕<sup>*</sup>; 李宇航<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于SentencePiece的中医学分词模型建模研究

作者：刘双巧; 周璐; 李彩艳; 袁慧敏; 张异卓; 李昱达; 刘锦钢; 郑丰杰; 孙燕^*; 李宇航^*

来源：世界中医药, 2021, 16(06): 981-990.

摘要

目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。

单位
北京中医药大学

收藏分享被引浏览

更新时间：2024-04-18 13:30

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号