基于多元统计分析和机器学习的验证码识别

作者:虞水磊; 田新宇*; 王金燕
来源:山东理工大学学报(自然科学版), 2019, 33(01): 60-64.
DOI:10.13367/j.cnki.sdgc.2019.01.013

摘要

针对带有噪声点与粘连的验证码图像,使用DBSCAN聚类与竖直投影法做去噪与分割处理,提出了基于AdaBoost方法的半监督Kmeans聚类算法。基于此算法对分割的单个字符图像进行了批量标注,在聚类结果的基础上使用Fisher判别、随机森林、K近邻、神经网络、支持向量机等方法进行训练并识别验证码测试数据集,比较各算法的识别效果,揭示所研究的验证码不安全的可能性.

全文