5.2. HeadHunter-T
我们用两个运动模型和一个基于颜色直方图的头部跟踪再识别模块扩展了HeadHunter,我们的运动模型包括粒子滤波预测目标运动和增强相关系数最大化补偿相机在序列中的运动,粒子滤波是一种递归估计动态系统状态的顺序蒙特卡罗(SMC)方法,在我们的实现中,我们表示后验密度函数由一组边界框建议为每个目标,称为粒子,粒子滤波的使用使我们能够同时模拟由于头部的快速运动和行人在帧间的位移而产生的非线性运动。
Notation 给定一个视频序列I,我们将其中的有序帧集表示为{I0,···,it 1},其中T为序列中的帧总数,在本文中,我们使用下标表示法来表示视频序列中的时间实例,在t时刻的帧It中,活动轨迹用Tt = {b1t, b2t,…表示, bNt},其中bkt为第k个活动轨迹的边界框,记为bkt =(XKT, ykt, WKT, HKT )在时间t时,第k个轨迹对应的第i个粒子用pk,i t表示,它们各自的重要权重用wk,i t表示,Lt和Nt分别表示未激活的轨迹和新初始化的轨迹的集合。
粒子初始化 新的轨迹在序列开始时初始化,从HeadHunter提供的检测I0开始,在帧It处初始化,用于无法与现有轨迹关联的检测,非最大抑制(NMS)方法解决了新检测与现有轨迹之间的合理关联,每个粒子的重要性权重在初始化时设置为相等,每个粒子表示4维状态空间,每个目标的状态建模为(xc, yc, w, h, xc, yc, w, h),其中,(xc, yc, w, h)表示边界框的质心、宽度和高度。
预测及更新 在时间t > 0时,我们对当前帧的特征映射Ft执行RoI池化,使用活动轨迹对应的粒子边界框,然后使用HeadHunter的回归头调整当前帧中的每个粒子的位置,给定它们在前一帧中的位置,从HeadHunter的分类头中将每个粒子的重要权重设置为各自的前景分类分数,我们的预测步骤类似于Tracktor,应用于粒子而不是轨迹,给定每个粒子的新位置和重要权重,将第k个轨迹的估计位置计算为粒子的加权平均值,
重采样 粒子过滤框架已知遭受简并问题,因此我们重新采样以替换低重要权重的粒子,当对每个头部位置的概率分布有意义贡献的粒子数量,ˆNkef超过阈值时,对第k个轨迹对应的M个粒子进行重新采样,其中,
Cost Matching 当轨迹的估计状态Sat的分数低于阈值,λregnms时,轨迹被设置为不活动。这些航迹的位置根据恒V速度假设(CVA)进行预测,如果它们与新探测到的轨迹具有令人信服的相似性,则恢复跟踪。相似性,C被定义为
其中Lit和Nj t分别是第i个丢失的轨迹和第j个新轨迹,d1为HSV空间中各自颜色直方图之间的Bhattacharyya距离,一旦轨迹被重新识别,我们就在它的新位置周围重新初始化粒子。
6. 实验
6.1. HeadHunter