摘要
随着经济的发展,越来越多的人参与医疗保险,享受到医保福利,但医保欺诈却给医疗保险基金带来了巨大的损失。针对传统的医保欺诈检测耗时长、效率低的问题,提出一种结合粒子群算法的加权K-均值的算法,从近30万条医疗记录中检测出疑似欺诈的记录。加权的K-均值算法将不同的属性赋予不同的权重值,为了得到一组根据数据的特性所得的权重值,引进权重指标评价函数CFuzziness(w)。当权重指标评价函数取极小值时,得到最优的权重值。采用粒子群优化算法来求解最优的权重值。聚类问题中簇类数目通常由用户确定,文中则用一种评估聚类的标准来确定最优的聚类数目。实验证明,算法不仅检测效率较高,还避免了主观评价对于检测的影响。
- 单位