网络视听媒体数据采集技术研究

作者:张伟; 陈树超; 张帆
来源:广播电视信息, 2016, (2): 49-52.
DOI:10.3969/j.issn.1007-1997.2016.02.014

摘要

目前,很多对应在线音视频服务平台的媒资系统建设仍旧处在摸索期,所存储节目的表述数据不尽相同,在门户呈现的节目描述数据也各自采用各自的组织和描述方式.本文分析了现有的网络内容信息爬虫技术,提出了适用于各类页面组织形式的数据采集方法,通过定制的螺旋采集策略和优化的爬虫程序,完成网络视听媒体内容信息的采集工作.

全文