摘要
本文针对旅客旅游保险的需求分析问题,基于年龄、就业类型、毕业与否、年收入、家庭成员数、是否患有慢性病、是否为飞行常客、是否曾出国旅行八个维度,分析调查了购买旅游保险的情况,研究和探讨决策树(DT)和随机森林(RF)分类模型在旅客购买旅游保险需求预测中的应用。两种模型确定了旅客的关键信息参数及其量化值,包括年收入、年龄、家庭成员数等。建立的模型诊断准确率达到80%以上,采用94颗决策树集成随机森林算法,ROC曲线中AUC面积从决策树的78%提高到81%。为分析旅客的旅游保险需求的评估提供了科学决策。