摘要

矮新星是一类特殊而稀少的半相接双星。发现更多的矮新星对于深入研究物质转移理论、理解密近双星演化过程意义深远。利用深度学习技术提取天体光谱特征并进而分类是天文数据处理领域的研究热点。传统的自编码器是仅包含一个隐层的经典神经网络模型,编码能力有限,数据表征学习能力不足。模块化拓宽神经网络的深度能够驱使网络继承地学习到天体光谱的特征,通过对底层特征的逐渐抽象学习获得高层特征,进而提高光谱的分类准确率。以自编码器为基础构建了由输入层、若干隐藏层和输出层组成的基于多层感知器架构的深度前馈堆栈式自编码器网络,用于处理海量的光谱数据集,挖掘隐藏在光谱内部具有区分度的深度结构特征,实现对矮新星光谱的准确分类。鉴于深度架构网络的参数设置会严重影响所构建网络的性能,将网络参数的优化分为逐层训练和反向传播两个过程。预处理后的光谱数据先由输入层进入网络,再经自编码器算法和权值共享实现对网络参数的逐层训练。反向传播阶段将初始样本数据再次输入网络,以逐层训练所得的权值对网络初始化,再把网络各层的局部优化训练结果融合起来,根据所设置的输出误差代价函数调整网络参数。反复地逐层训练和反向传播,直到获得全局最优的网络参数。最后由末隐层作为重构层搭建支持向量机分类器,实现对矮新星的特征提取与分类。网络参数优化过程中利用均值网络思想使网络隐层单元输出按照dropout系数衰减,并由反向传播算法微调整个网络,从而防止发生深度过拟合现象,减少因隐层神经元间的相互节制而学习到重复的数据表征,提高网络的泛化能力。该网络分布式的多层次架构能够提供有效的数据抽象和表征学习能力,其特征检测层可从无标注数据中隐式地学习到深度结构特征,有效刻画光谱数据的非线性和随机波动性,避免了光谱特征的显式提取,体现出较强的数据拟合和泛化能力。不同层之间的权值共享能够减少冗余信息的干扰,有效化解传统多层次架构网络易陷入权值局部最小化的风险。实验表明,该深度架构网络在矮新星分类任务中能达到95.81%的准确率,超过了经典的LM-BP网络。

  • 单位
    山东大学(威海)