摘要
大数据作为重要的数据资源存在,不论是其内在蕴含的信息价值还是其已经成为人类社会所需数据有机组成的客观事实,都迫使我们去不断加强对大数据的应用。然而,由于大数据作为信息技术应用的副产品,其复杂性、不确定性和涌现性决定了我们应用大数据并非易事,存在着很多质量上的问题,除了具有传统数据所有的质量问题外,还包括一些独特的新问题。为了更好地应用大数据,本文对如何进行大数据应用的质量控制进行了初步的研究。主要内容包括以下三个方面:一是对什么是大数据质量、受哪些因素影响、可能存在哪些质量问题进行了探讨;二是从做好理论准备、建立质量控制方案、重视对小数据研究、加强大数据管理、加强大数据人才培养和加强大数据法制建设六个方面,提出了大数据应用的质量控制的基本想法;三是对大数据应用中需要引起注意的几个方面进行了讨论,并结合例子进行了阐释。
- 单位