一种用于数据挖掘算法的数据生成方法

魏伟杰; 张斌; 王波; 张明卫

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种用于数据挖掘算法的数据生成方法

作者：魏伟杰; 张斌; 王波; 张明卫

来源：东北大学学报(自然科学版), 2008, (03): 328-331.

摘要

由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.

单位
东北大学

收藏分享被引浏览

更新时间：2023-11-16 17:53

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号