网络视听媒体数据采集技术研究

作者:张伟; 陈树超; 张帆
来源:广播电视信息, 2016, (02): 49-52.
DOI:10.16045/j.cnki.rti.2016.02.015

摘要

目前,很多对应在线音视频服务平台的媒资系统建设仍旧处在摸索期,所存储节目的表述数据不尽相同,在门户呈现的节目描述数据也各自采用各自的组织和描述方式。本文分析了现有的网络内容信息爬虫技术,提出了适用于各类页面组织形式的数据采集方法,通过定制的螺旋采集策略和优化的爬虫程序,完成网络视听媒体内容信息的采集工作。

全文