摘要

本文研究实现一种轻量级平滑迁移技术,而无需改动原有Web数据平台。研究基于银河麒麟操作系统+飞腾处理器的自主可控软硬件,开展针对静态与动态的非交互Web数据平台抓取技术研究。主要涉及目标URL页面的读取与下载、页面过滤、结构解析与数据获取等。本研究的轻量级迁移方法,避免了重新对原有系统迁移和重构的高昂投入,降低Web系统迁移到自主可控平台的开发周期和资金,为系统自主可控迁移提供一种新思路。

  • 单位
    新疆师范高等专科学校; 现代教育技术中心