摘要
为了评估数据集噪声的影响,引入了NIN (network in network)模型,研究了不同类型和比例的噪声对深度卷积模型的负面影响.将不同种类和比例的数据噪声加入基准数据集Cifar-10和Cifar-100,然后使用这些包含噪声的数据来训练深度卷积模型,并对验证数据集进行分类.实验结果表明,数据集中的噪声对深度卷积网络分类模型确实有明显的不利影响.其中,随机噪声的不利影响很小,但是类别之间的跨类噪声却显著地降低了模型的识别能力.因此,提出了一种解决方案用来改进混入单类别噪声的数据集质量,即用含有噪声的数据集训练的模型评价当前训练数据,并将异常的类别重新归类以形成新的数据集.经过多轮迭代训练,可以大大降低其噪声比率,从而可以有效避免交叉类别噪声的影响.
- 单位