摘要
实际应用中存在大量动态增加的区间型数据,若采用传统的非增量正域属性约简方法进行约简,则需要对更新后的区间值数据集的正域约简进行重新计算,导致属性约简的计算效率大大降低。针对上述问题,提出区间值决策表的正域增量属性约简方法。首先,给出区间值决策表正域约简的相关概念;然后,讨论并证明单增量和组增量的正域更新机制,提出区间值决策表的正域单增量和组增量属性约简算法;最后,通过8组UCI数据集进行实验。当8组数据集的数据量由60%增加至100%时,传统非增量属性约简算法在8组数据集中的约简耗时分别为36. 59 s、72. 35 s、69. 83 s、154. 29 s、80. 66 s、1 498. 11 s、4 124. 14 s和809. 65 s,单增量属性约简算法的约简耗时分别为19. 05 s、46. 54 s、26. 98 s、26. 12 s、34. 02 s、1 270. 87 s、1 598. 78 s和408. 65 s,组增量属性约简算法的约简耗时分别为6. 39 s、15. 66 s、3. 44 s、15. 06 s、8. 02 s、167. 12 s、180. 88 s和61. 04 s。实验结果表明,提出的区间值决策表的正域增量式属性约简算法具有高效性。
- 单位