摘要
目前,土地工程基金项目在深层次的主题挖掘方面尚不成熟,还没有利用文本挖掘及机器学习算法研究土地工程领域的方向和演化态势,基于此,笔者提出一种基于LDA模型的土地工程基金项目文本挖掘算法。首先,以Python编程语言为基础,配合使用requests、BeautifulSoup等库抓取国家自然基金网站已结题项目文本;其次,通过K-means聚类、词频一逆文档频率法(TF-IDF法)构建Top100关键词云图;最后,利用LDA模型挖掘技术土地工程基金项目的核心主题,揭示土地工程基金项目的主题研究方向。
- 单位