基于云计算Hadoop平台的文本挖掘预处理方法

张爱科

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于云计算Hadoop平台的文本挖掘预处理方法

作者：张爱科

来源：上海工程技术大学学报, 2017, 31(02): 115-119.

摘要

随着信息社会的快速发展,网络数据正在指数级地增长,其中大部分都是文本数据.如何在有限的时间内完成大规模的文本数据挖掘分析,已成为当前的热点研究问题.文本预处理是整个挖掘过程中最耗时的环节,分布式并行处理可以缩短该过程的挖掘时间.设计分析了基于云计算Hadoop平台的文本预处理MapReduce并行化过程,并对预处理的Map函数和Reduce函数进行了详细介绍.通过实验证明,和单节点运行相比,改进后的并行化方法具有更好的性能.

单位
柳州职业技术学院

收藏分享被引浏览

更新时间：2021-08-12 16:47

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号