基于Java技术的新闻采集器设计与实现

作者:赵敏涯; 华英; 吴笛; 黄鹏; 赵明明
来源:电脑编程技巧与维护, 2019, (04): 21-37.
DOI:10.16184/j.cnki.comprg.2019.04.007

摘要

以网易新闻为研究对象,基于Java技术设计实现了一个简单的新闻数据采集器,从数据库设计、ORM技术、爬虫程序、页面解析等方面进行了实践。采集器充分利用面向对象原理,以集合框架List和Set对数据以对象形式进行存取,实现了对数据库的增删改查等操作。实验结果表明,本程序可以有效地实现网页数据的快速获取,并可以在此基础上进一步为数据挖掘、新闻展示等应用提供数据源。

  • 单位
    苏州市职业大学

全文