摘要

规国房系统是辅助政府和企业实现审批、办公的高效协同办公软件,多数情况在内网部署,使得用户获取行业外部资讯困难,现存系统也存在资讯更新慢、行业信息聚合性弱、海量资讯筛查困难等问题。本文利用网络爬虫技术有效解决内网用户获取外部信息渠道和时效性问题,同时融合互联网思维,根据用户行为数据建立用户兴趣模型,采用热度值倒排的方式解决用户冷启动和内容库数据量大的问题,利用TF-IDF关键字提取技术和余弦相似度算法实现用户兴趣和内容精准匹配,最终实现个性化资讯推荐。