摘要
[目的]以数据和算法为基础对科研人员学术专长进行自动识别,从而为科研项目评审、人才评价等多种应用提供支撑。 [方法]首先,采用“冰山模型”理论描述科研人员学术专长,“冰山”可见部分揭示科研人员擅长领域和方向,识别科研人员核心竞争力和主攻方向;“冰山”以下部分识别科研人员相对擅长或具有“比较优势”的专长。进而,通过标签表征科研人员学术专长,利用LDA和BERT机器学习技术对科研人员学术标签进行抽取、聚类并生成矩阵,最终提出并计算科研人员的“自身专注指数”和“同行相对指数”两个量化指标,反映人员的主要研究领域及其与科学共同体的相对位序。 [结果]以20名科研人员为例,共生成8985组标签词及其对应权值,以细粒度对人员专长进行了描述;并基于领域-人员矩阵(40×20)完成了自身专注指数和同行相对指数计算,结果表明,该方法可以较为准确反映科研人员擅长的细分研究领域及其在科学共同体的相对位序,从而实现人员专长识别。 [局限]后续有待加入时间因素,以更好的反映人员专长的时序演变特征。 [结论]本方法的优点在于,一方面“冰山模型”可以有效解释人员“做什么”和“做的怎么样”,为标签抽取和指数设计奠定理论依据并提高解释力。另一方面提出了可量化比较的专长指数计算方法,实现细粒度、精准化、动态化的人才专长揭示。
- 单位