摘要
特征工程可以自动地处理和生成那些判别性高的特征,而无需人为的操作。特征工程在机器学习中是不可避免的一环,也是至关重要的一环。提出一种基于强化学习(RL)的方法,将特征工程作为一个马尔可夫决策过程(MDP),在上限置信区间算法(UCT)的基础上提出一个近似的方法求解二分类数值数据的特征工程问题,来自动获得最佳的变换策略。在5个公开的数据集上验证所提出方法的有效性,FScore平均提高了9.032%,同时与其他用有限元变换进行特征工程的方法进行比较。该方法确实可以得到判别性高的特征,提高模型的学习能力,得到更高的精度。
- 单位