摘要
车险业务中影响车险损失的风险因子很多,如从人因子、从车因子、从属地因子和保单属性因子等,保险公司通常利用这些风险因子对个体风险进行分类,一方面作为车险定价的依据,另一方面也为部门沟通、业务选择和市场细分提供支持。因此,识别风险因子的重要性对提升整个车险业务质量有非常重要的意义。近年来机器学习算法在车险损失预测中的应用越来越多,但目前的研究主要考虑了损失预测的精度,对风险因子的重要性测度缺少系统深入的研究。为此,本文对8个车险数据集,利用两种集成学习方法(随机森林和XGBoost),比较了它们与广义线性回归模型在索赔频率风险因子重要性测度上的一致性。研究结果表明,这两种集成学习方法不仅能提高预测精度,还能提供较一致的风险因子重要性测度。
- 单位