针对高校各类业务数据结构复杂、数据增长迅速等特点,文章提出基于Hadoop和MPP数据库混合构建高校数据集成平台,对平台中的复杂查询、数据关联、自助分析等逻辑加工场景应用MPP数据库,对海量的日志数据、文本数据等非结构化和半结构化数据采用Hadoop存储计算。平台采用了分层架构的策略,分为源数据层、数据处理层和数据应用层,实现了高校数据的集中采集、分类存储、有效整合,保证了数据的治理质量和处理效率。