基于向量空间模型的文本相似度计算方法

王嘉旸; 杨丽萍; 闫天伟

doi:10.13838/j.cnki.kjgc.2017.02.002

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于向量空间模型的文本相似度计算方法

作者：王嘉旸; 杨丽萍; 闫天伟

来源：科技广场, 2017, (02): 9-13.

DOI：10.13838/j.cnki.kjgc.2017.02.002

摘要

文本的向量空间模型是把文本量化为空间里的向量,文本相似度的计算即对向量相似性的计算。本文通过分析传统的基于向量空间模型(VSM)文本相似度计算算法存在的不足,提出一种改进的文本相似度计算算法。改进算法充分考虑到了文本间向量空间模型相似度比较忽略了文本长度的缺点,引入文本长度参数,并在基于互信息的特征词抽取时考虑词频的因素对文本相似度的影响,有效减少了相似度低的文本干扰。实验结果验证了改进算法的有效性和准确性。

单位
南昌大学信息工程学院; 江西农业大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-27 08:21

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号