基于决策树算法的客服终端冗余数据迭代消除方法

作者:张莉*; 丁毛毛; 李玮; 王颖; 吕静贤; 王笑一
来源:计算技术与自动化, 2022, 41(04): 118-122.
DOI:10.16339/j.cnki.jsjsyzdh.202204019

摘要

为了提高客服终端数据可利用性,降低冗余数据干扰程度,挖掘潜在客户,制定销售策略,研究一种基于决策树算法的客服终端冗余数据迭代消除方法。采用数据仓库法抽取并集成客服终端数据,对字符类数据进行去停用词和中文分词预处理,对数值类数据进行缺失值填补和离散值删除预处理。构建ID3决策树,分类客服终端数据,计算同一类数据的类间相似度,构建冗余数据判断规则,检测客服终端冗余数据,联合消除器消除冗余数据。实验结果表明:所研究方法应用后,可以消除客服终端冗余数据,空间缩减比更接近冗余率。

全文