摘要
数据挖掘技术已经成为一种利用装备数据资源获取知识的重要手段,数据预处理是装备质量信息分析的重要环节。为解决数据类型不适应数据挖掘方法的问题,提出了一种装备质量数据离散化方法。对经典类别属性最大相互依赖算法的原理和流程进行了介绍,分析了存在的问题,提出了改进方法;引入了粗糙集理论和属性分辨率,限制了过度离散化;提出了属性重要性评价方法,减少了信息损失。对比实验结果表明,所提出的方法具有优越性,能提高数据离散化效果。以某型装备为例,将所提方法应用于关联规则挖掘之前的数据预处理,获得了与装备寿命周期内质量变化规律相关的知识,验证了该方法的有效性。
-
单位中国人民解放军陆军工程大学