摘要

以泰坦尼克号海难幸存者数据为样本,基于LMT模型进行特征工程分析。首先,通过定性分析初步判定各属性对预测变量的影响方向和程度,同时进行初期特征工程。其次,进行定量分析,利用皮尔孙相关热图理清各属性间的相关关系,生成特征相关图,量化相关程度以进行冗余变量的剔除工作。最后,综合比较四种算法的准确度可知,LMT算法的模型拟合度最高,乘客幸存率与属性Name、Sex、Pclass、Age、SibSp、Parch、Fare、Cabin、Embarked高度相关。基于以上结果,对船舶安全管理提出总结与展望。

  • 单位
    上海外国语大学