多示例学习下的增量数据挖掘

魏秀参; 徐书林; 安鹏; 杨健

摘要

近年来多示例学习被广泛应用于复杂数据问题中，但现有的多示例学习算法往往在封闭静态环境中工作良好，其所处理的类别数量也恒定不变．然而在现实应用当中，常会有新的类别不断的加入到系统当中，例如科学的发展中不断出现新的议题、社交媒体中不断出现新的话题．由于存储限制或保密协议等原因，旧数据可能随着时间的发展变得不可见，这使得直接学习新的类别时模型会忘记曾经学过的知识．增量学习则被用于解决上述问题．因此，在多示例学习设定下进行增量数据挖掘十分有意义，然而目前针对多示例学习下的增量数据挖掘的工作十分稀少．我们提出一个基于注意力机制和原型分类器映射的多示例增量数据挖掘方法，通过注意力机制选择性的将多示例包的示例汇合为统一的特征表示，然后为每个类别生成类别原型表示并存储下来．类别原型通过原型分类器映射模块得到无偏鲁棒的类别分类器，并通过上一个增量阶段生成的分类器的预测结果对新增量阶段生成的分类器的预测结果进行知识蒸馏，使得模型能够在多示例学习下以极低的存储很好的保留模型的旧知识．实验结果表明，我们提出的方法能够有效地进行多示例学习下的增量数据挖掘．

单位
计算机软件新技术国家重点实验室; 南京大学; 南京理工大学; 综合业务网理论及关键技术国家重点实验室; 中国海洋石油集团有限公司; 西安电子科技大学

收藏分享被引浏览

更新时间：2024-05-23 21:32

多示例学习下的增量数据挖掘

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友