随着计算机网络的发展,包含有音频等多种信息形式的动态页面广泛应用,动态页面的应用为页面数据提取带来了一定难度。针对分布式数据库的特点从大数据网络平台中建立了一套动态页面数据生成系统,首先用MapReduce方法对分布式数据库的大数据进行了预处理,之后根据页面JavaScript脚本特点建立了脚本提取子系统,结合分布式数据存储方式建立了动态页面信息采集系统,最后对系统功能进行了测试分析。