人群密集的复杂场景中人体目标会互相遮挡,容易导致行人检测出现漏检。针对此问题,选择人体较显著的局部特征——人体头部作为检测目标,基于多任务级联卷积神经网络模型,采用自建的人体头部数据集进行模型训练,实现复杂场景中的行人人体头部检测。实验结果表明,该方法可有效提高复杂场景下的行人检测准确率,而且检测速度满足实时检测的要求。