摘要

[目的/意义]引入IMRD架构对论文的关键词进行细分与归类,有利于挖掘各类关键词的潜藏信息,丰富论文创新性评价指标的层次结构和内容,从而提升评价指标的精确性、科学性。[方法/过程]应用文本处理技术和LDA主题模型提取论文的关键词,根据IMRD架构将论文的关键词分为Topic关键词和Method关键词,结合两类关键词的相似度和相似论文数量等因素计算论文相似值,继而根据关键词的类别特征分别构建Topic关键词学科热度值、学术潜力值及Method关键词创新性的数学模型。最后,整合论文创新性的各种影响因素,构建一个多维度、多层次的论文创新性评价指标。[结果/结论]以CNKI数据库中“篇关摘”含有“自然语言处理”的中文期刊论文为实证对象,结果表明本文构建的创新性评价指标能有效区分具有不同创新水平的论文。