基于命名实体n-gram图的文本相似性度量

于营<sup>*</sup>; 周显春; 贾树文

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于命名实体n-gram图的文本相似性度量

作者：于营^*; 周显春; 贾树文

来源：现代计算机(专业版), 2022, 28(02): 73-77.

摘要

文本比较在自然语言处理中应用广泛。本文提出了一种新的文本相似性度量方法，该方法利用从文本和n-gram图中提取的命名实体信息来表示文档，使用OpenCalais作为命名实体识别服务，使用JInsect工具箱来构造和管理n-gram，使用文本聚类算法k-Means进行文本相似性度量，使用各种聚类有效性指标对生成的聚类进行评估。

单位
三亚学院

收藏分享被引浏览

更新时间：2024-03-19 22:02

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号