基于深度森林的量表数据挖掘方法

作者:佟彤; 罗森林; 潘丽敏; 张铁梅
来源:电子设计工程, 2020, 28(13): 88-96.
DOI:10.14022/j.issn1674-6236.2020.13.020

摘要

在数据挖掘领域中,量表是间接获取样本属性数据的重要工具。针对量表数据离散、稀疏、二值化的特点,导致其难以进行分析挖掘的问题。文中采用了基于深度森林的量表数据挖掘方法,实验分别对老年健康综合评估数据库中的两个量表进行对比分析。实验结果表明,在所选取的两个量表中,提取到的关键属性数量相比于原始量表属性数量分别下降了30%和40%,且比基线模型下降了16%和18%。同时,提出的方法可在保证分类性能基本不变的情况下,进一步降低提取到的关键属性数量。