摘要

随着大数据时代的到来,如何提高海量数据的新增与更新效率成为当前的研究重点。基于此,笔者对Greenplum数据库的高效插入、更新海量数据的方法进行了研究。在新增数据方面,Greenplum数据库除了insert指令外,还提供了外部表、copy指令、gpfdist组件来提高新增海量数据的效率,效率可以提升百倍;在更新数据方面,gpfdist组件和外部表的联合使用可以大大提高数据的更新效率。