摘要
随着大数据时代的到来,数据的结构变得越来越复杂,数据集的维度变得越来越高,这极大地影响了数据挖掘的效率。因此,很有必要进行数据压缩或对信息系统进行属性约简,即去掉不必要的冗余属性,降低数据维度,提高数据挖掘效率。在现实生活中,人们对数据集中每个条件属性的关注度往往是不一样的。首先,在经典模糊决策数据集的基础上,对不同的条件属性进行加权,定义加权得分函数,进一步建立带关注度的模糊序决策信息系统。然后在该系统中引入分布函数,并通过分布可辨识矩阵建立求分布约简的方法。最后,通过案例分析验证了该方法的可行性。
- 单位