摘要

多粒度形式概念分析是数据挖掘与知识发现的重要工具,但现有的多粒度形式概念分析理论中并未提出选择最优形式背景的标准,这导致只能对多个单粒度形式背景逐一研究其知识发现问题,因此无法应对含有多个粒度属性的形式背景.鉴于此,对多粒度形式背景的粒度树上的属性块进行组合,将信息熵作为组合形式背景优劣的判别标准以评价最优粒度选择的性能.首先,基于粒度树提出广义介粒度剪枝形式背景,它既能实现属性块内部跨粒度组合,又能实现属性块之间跨层组合;其次,给出广义介粒度剪枝形式背景的信息熵,以评价广义介粒度剪枝形式背景的优劣,并设计出最优粒度选择算法;接着,利用信息熵度量多粒度剪枝类属性块和粒度树的重要性;最后,通过实验分析表明基于信息熵的最优粒度选择和粒度树重要性度量方法是有效的.

全文