摘要
数据的重要作用和价值体现是应用。数据成果被应用和再应用是该数据具有科学影响力的重要体现,也是对科学贡献的一种表现方式。如何对数据成果科学影响力进行定量化评价是目前学术界的一个空白。作者提出数据成果、数据作者对科学的影响力可以用计量化方式表达,该计量方法采用"数据影响力积分"(Data Impact Score,DIS)方法,即以引文为基础、以引用数据的论文发表的学术期刊影响因子为权重作为核心参数的统计学方法。本文给出了"数据影响力积分"中数据成果影响力积分(DISD)和数据作者影响力积分(DISA)的计算模型和计算案例。在数据成果影响力积分计算中,本文给出了一年数据影响力积分模型(DISDy)和多年累计数据影响力积分模型(DISDmy)。在作者数据影响力积分中,本文给出了多位作者完成的数据成果中每位作者数据影响力积分分配模型(DISAi)、多数据成果的数据作者一年数据影响力积分模型(DISAy)和作者多年累计数据影响力积分模型(DISAmysum)。本文例举"全球变化科学研究数据出版系统"自2014年6月至2018年5月间出版的数据为例,详细地说明了数据影响力的计算过程和计算方法。数据科学影响力不仅可以对数据成果、数据作者在科学数据领域的影响力进行计量,也可以应用于对数据中心、作者所在单位、基金项目资助产生的科学数据的影响力进行定量化评价。值得一提的是任何计量方法都有其局限性一面。本文对该计量方法的局限性也进行了讨论。
- 单位