运用传统的User-Based协同过滤算法计算用户相似度时,因数据过度稀疏而易造成较大的计算偏差。为了有效提高该算法的准确性,研究改进相似度计算方法。根据用户现有的评分数据计算每个项目的自信息量,根据自信息量为不同的项目分配权值,利用权值来修正传统的相似度计算方法。当用户共同评分项目数量较少时,增加惩罚因子,以避免评分相似所致相似度过高的问题。