现有的知识发现和数据工程技术在许多实际应用中取得了巨大的成功,但从不平衡数据中学习的问题是一个相对新的挑战,引起了学术界和工业界的日益关注。由于不平衡数据集固有的复杂特性,从这些数据中学习需要新的理解、原理、算法和工具,以便将大量原始数据有效地转换为信息和知识。在本文中,我们全面回顾了从不平衡数据中学习研究的发展。我们的重点是对问题的性质、最先进的技术以及当前用于评估不平衡学习进行讨论。