摘要
本研究基于自动分词技术,通过对一段时间内国家科技管理部门发布的具有代表性的规范性文件进行量化评价研究,在词频统计的基础上,引入资讯检索与文本挖掘常用加权技术TF-IDF,评估单一字词对于文本整体的重要程度,从而进一步整理出科技部党组1号文件中常年出现的高频词、体现时代特点的高频词和近年新出现的高频词,对比具有特点的高频词,从而深入梳理国家宏观科技创新政策的发展脉络,对我国宏观科技创新政策进行深入研究。
- 单位
本研究基于自动分词技术,通过对一段时间内国家科技管理部门发布的具有代表性的规范性文件进行量化评价研究,在词频统计的基础上,引入资讯检索与文本挖掘常用加权技术TF-IDF,评估单一字词对于文本整体的重要程度,从而进一步整理出科技部党组1号文件中常年出现的高频词、体现时代特点的高频词和近年新出现的高频词,对比具有特点的高频词,从而深入梳理国家宏观科技创新政策的发展脉络,对我国宏观科技创新政策进行深入研究。