摘要

同步辐射光源产生超高速的衍射图像数据流,需要通过数据筛选降低数据传输和存储的压力。但互相竞争的研究小组不愿意分享数据,现有基于深度学习的筛选方法难以应对隐私保护下有效训练的挑战,因此首次将联邦学习技术应用在辐射光源衍射图像筛选中,通过数据和模型分离,实现提供隐私保护下的训练数据增广;又提出筛选方法 FedKL(Federated Kullback-Leibler),基于改进的KL散度(Kullback-Leibler Divergence)和数据量权重对全局模型更新进行改进,在获得高准确率的同时降低算法的复杂度,满足高速数据流高精度处理要求;针对异地光源多中心数据同步训练的困难,又提出同步和异步相结合的混合训练方式,在不降低模型识别准确率的同时,显著提升了模型的训练速度。在光源CXIDB-76公开数据集上的实验表明,FedKL能够提升准确率和F1分数高达25.3%和0.491。