摘要
针对钢筋混凝土柱破坏模式数据集存在类不平衡,导致传统机器学习算法对少数类破坏模式判别精度较低的问题,采用合成少数类过采样(SMOTE)算法合成少数类样本生成初始平衡数据集,利用基于特征权重的加权K-近邻算法衡量数据集样本的类内相似度,通过合理剔除离群值样本数据点重构新平衡数据集,并基于331组钢筋混凝土柱破坏模式不平衡数据(弯曲破坏203组、剪切破坏70组、弯剪破坏58组),结合6种经典机器学习算法,建立了基于类不平衡数据集的钢筋混凝土柱破坏模式判别方法。研究表明:与传统方法相比,该方法对于剪切破坏的精度、召回率和F1分数分别平均提高5.5%、8.7%和7.2%,对于弯剪破坏的精度、召回率和F1分数分别平均提高12.8%、15.7%和17%;随着破坏模式样本数据集不平衡程度的增大,该方法对机器学习算法分类性能的提升效果越明显。
-
单位建筑工程学院; 广西防灾减灾与工程安全重点实验室; 广西大学