一种Spark GraphX框架下的关键词抽取方法

程传鹏

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种Spark GraphX框架下的关键词抽取方法

作者：程传鹏

来源：小型微型计算机系统, 2019, 40(02): 328-331.

摘要

TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模较大的时候,计算时间尤为可观.针对此问题,提出了一种基于Spark GraphX的关键词抽取方法,利用Spark GarpX所提供的分布式计算的图框架,将文本图数据分布式存储在不同的节点上,高效地实现了文本关键词的抽取.实验表明,本文中提出的基于Spark GraphX的关键词抽取方法,不仅计算时间短,抽取的关键词与人工标注的结果非常接近,具有一定的合理性.

单位
中原工学院

收藏分享被引浏览

更新时间：2024-04-11 13:42

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号