摘要

【目的】构建基于迁移学习的社交网络图像隐私自动分类器,对用户进行合理的提示,避免用户无意间上传包含隐私信息的内容。【方法】本文构建并标注了微博图像隐私分类数据集,采用深度迁移机器学习,尝试微调多种不同的图像预训练模型,对新浪微博图片是否包含隐私进行自动化分类。【结果】以相同的数据量,通过与非迁移学习方式对比,迁移学习的准确率至少提升了30%。迁移学习方式下,大部分ResNet深度神经网络架构的准确率可以达到88%以上。其中,ResNet50拥有最高的召回率(94.31%)、准确率(90.80%)和F1值(91.11%),且测试耗时最短(148 s),综合权衡对比,是最为适合当前场景需求的模型架构。【局限】标注的数据量相对偏少,可能没有囊括某些其他隐私类型。【结论】本文验证了深度迁移学习在微博隐私图片分类领域的可行性,可以为社交媒体用户提供隐私曝露预警。构建的微博图片隐私分类数据集为后续研究提供了基础和参考对照标准。