摘要

评价权威报刊的新闻重要性对于正确理解国家政策变化具有重要意义。该文以《人民日报》为例,抽取发表在1946-2008年期间的新闻,利用其内容相似性构建新闻网络。从复杂网络视角,一篇新闻与其他新闻的相似性越高,其在新闻网络中连接越紧密,具有较大的节点中心性。鉴于此,该文将H指数引入PageRank排序算法,提出H-PageRank排序算法,利用其计算H-PageRank中心性,评价新闻重要性。在实验过程中,考虑到不同领导核心执政时期《人民日报》的新闻风格与新闻版面的差异性将新闻划分为4个时代,基于表示学习分别形成对应的新闻网络。研究结果表明:1) 4个新闻网络的拓扑结构都表现出高聚类性与同配性,且具有近似幂律的度分布,表现出复杂网络一般特性;2)基于多种网络节点中心性指标,对每个新闻网络中的节点进行全局排序,并以是否成为头版新闻为重要性的评价准则计算得到相近的AUC值,然后基于局部排序的Top-N评价方法计算得到正确率、召回率和F1指标,综合以上指标的实验结果表明,H-PageRank中心性显著优于其他算法的中心性,验证H-PageRank排序算法的有效性;3)针对每个新闻网络,基于网络节点中心性的Top-N评价方法不同排序列表长度条件,其计算得到的正确率显著高于理论基准,表明评价方法的鲁棒性。