基于特征词配对的德语文本聚类方法研究

简梓炜; 于娟

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于特征词配对的德语文本聚类方法研究

作者：简梓炜; 于娟

来源：情报探索, 2022, (09): 86-93.

摘要

[目的/意义]提出一种适用于德语文本处理的文本相似度计算方法，填补了国内外德语文本聚类研究的空缺。[方法/过程]通过词语提取和特征词选择将每个德语文本表示为一个特征词的集合，寻找集合间配对的特征词对，由特征词对的匹配度得到文本间的相似度。[结果/结论]基于多个德语数据集的实验结果表明，相比于已有方法，本文提出的基于特征词配对的德语文本聚类方法提升了约5%的NMI值和约6%的Purity值。基于特征词配对的相似度计算方法能够保留更多的文本信息，从而进一步提升德语文本聚类的性能。

单位
福州大学

收藏分享被引浏览

更新时间：2024-03-19 16:10

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号