摘要

在大规模集群稀疏数据中使用混合特征技术处理海量大数据,可以显著优化推荐算法的可扩展性。于是设计了量稀疏大数据混合特征个性化推荐算法。利用逻辑运算方法处理稀疏数据,获取数据之间的关联性系,并及时填补缺失数据。针对大数据具有的数值和属性两种混合特征,通过计算相异性测度,建立混合特征聚类目标函数,实现数据聚类。基于聚类结果,从登陆、注册、检索浏览习惯等方面采集用户行为特征信息。采用显著数据分区检测方法融合用户信息,建立用户偏好挖掘模型,以行为偏好为基础,计算用户对内容的评分情况,将所有项目按照评分值排序,生成推荐列表。仿真结果表明,研究方法的同类大数据聚类准确度更高,平均绝对误差低于0.04,验证了上述方法的推荐结果可满足用户需求。