摘要

针对我国住房租赁市场存在的信息不对称、租金不够透明问题,提出基于互联网数据和机器学习的住房租金预测方法。以深圳市居住小区租金为例,系统比较了支持向量回归、前馈神经网络、XGBoost、随机森林、K近邻5种机器学习回归算法的预测绩效,并采用集成学习理论对模型有效性进行了增强,同时从机器学习的角度对住房租金影响因素进行了分析。结果显示:随机森林和XGBoost在住房租金预测问题上的预测性能优于其他机器学习模型,而基于集成学习理论构建的组合预测模型则优于个体机器学习模型。进一步地,基于树集成方法的特征重要性分析发现,交通、教育以及区位条件是影响住房租金的关键影响要素。

全文