基于词的关联特征的中文分词方法

李康康; 龙华

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于词的关联特征的中文分词方法

作者：李康康; 龙华

来源：通信技术, 2018, 51(10): 2343-2349.

摘要

汉语自动分词是汉语信息处理的前提。在总结和分析常用中文分词方法中发现,基于词频统计的中文分词方法受语料库的限制会出现部分真正的词,但它的可信度小而被忽略,而一些不是词的可信度太大会误判成词。因此,在此分词方法的基础上,提出了一种基于词的关联特征的中文分词方法。算法首先在中文文档中统计出可能成词的文本片段的词频,其次计算出文本片段的自由度和凝合度,最后提出了三元词和四元词过滤方法。实验证明,算法能够提高分词精度。

单位
自动化学院; 昆明理工大学

收藏分享被引浏览

更新时间：2024-04-24 13:17

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号