摘要

为优化出版服务,带动出版行业的转型升级,提高图书选题策划中的效率,研究对数据挖掘图书选题策划进行设计,利用Jsoup技术对网络数据进行提取,并利用Hadoop技术进行云储存,可将储存在Hadoop分布式文件系统(HDFS)上的数据进行分析,进行数据挖掘试验,验证数据挖掘技术在图书选题策划中的应用可行性。结果表明:该系统能有效的进行图书信息的收集、整理分析、储存和数据挖掘,特别是能在大数据量的情况下进行有效的运算,挖掘有一定的准确度,可以在图书选题策划中提供数据支撑,提高了出版社了解市场、读者信息的效率。