摘要
针对配备了摄像机和麦克风阵列的智能环境中说话人跟踪问题,提出了一种考虑运动说话人状态记忆效应的跟踪方法。该方法在粒子滤波框架内,融合说话人动态模型,通过粒子状态在时间上的连续预测克服虚假声源对跟踪精度的影响;通过借鉴粒子群算法中粒子的交互能力,通过优化适应度函数,引入适应度衰减机制,实现粒子记忆状态的跨时间传递,确保在发生说话人动态模型不匹配或当前观测错误的情况下,实现过往最佳匹配信息的记忆传递,并通过粒子相互作用,共享适应度信息,加快收敛速度,有效改善了粒子的收敛性能。实验结果表明,方法较好改善了不同复杂环境下的跟踪性能。
-
单位四川师范大学; 成都师范学院