面向自动可视化的可解释数据变换推荐(英文)

作者:吴子梁; 陈为*; 马昱欣; 徐彤; 严凡; 吕檑; 钱中昊; 夏佳志
来源:Frontiers of Information Technology & Electronic Engineering, 2023, 24(07): 1007-1028.

摘要

自动可视化技术能够为不熟悉可视化设计的用户生成有意义的可视化,以支持他们的数据分析和模式发现需求。当前,主流的自动可视化方法采用聚合与过滤从原始数据抽取模式信息。然而,这些有限的数据变换并不能捕获聚类、关联等复杂的模式。尽管特征工程领域的最新进展为更加广泛的自动数据变换提供了可能,其结果却缺少可解释性,导致变换后的模式无法与原始数据特征建立联系。为应对上述挑战,我们面向自动可视化中广泛的数据变换类型,提出一种创新的可解释推荐方法。我们通过回顾既往文献总结可行的数据变换空间,通过开展预实验总结变换可解释性的度量。我们的推荐算法能够计算最优的数据变换,这种变换能够在维持可解释性的同时揭示数据的模式信息。真实场景下的使用案例与用户实验验证了我们方法的有效性。