摘要
由于大数据的数据量大和数据价值密度低的特性,用于解决信息过载的协同过滤推荐算法存在数据稀疏性问题,进而引发推荐效果不佳的结果,基于该问题提出了一种面向用户及评分信息的混合数据聚类推荐算法HDCRA(hybrid data clustering recommendation algorithm).针对既有评分数据和属性数据的用户混合数据,对用户进行相似度的计算并对用户进行聚类,使得在各个聚类簇中用户在各个维度上都比较相似,最后在聚类簇中为目标用户找到邻居,并对目标用户进行协同过滤推荐.实验结果证明,该算法有效缓解了数据稀疏的问题,而且在推荐质量的提高上有一定效果.
-
单位太原师范学院