表6.2总结了上述方法在CroHD测试集上的性能,HeadHunter-T方法的性能优于其他所有方法,并且在身份识别保持跟踪方面表现出了优势,虽然Tracktor类似于HeadHunter-T,但在头部跟踪性能上有明显的区别,我们假设使用粒子过滤框架,它可以处理任意后验,作为改进的原因,这一主张将在下一节中得到证明。
![](http://imgq8.q578.com/ef/1115/88ea55aa387bc98d.jpg)
6.3. 消融实验
HeadHunter-T:在本节中,我们分析了设计选择,特别是HeadHunter-T的再识别模块和粒子滤波在CroHD训练集上的应用,结果汇总在表5中,对于运动模型的变化,我们删除了粒子滤波器,并使用简单的相机运动补偿,记为HT w/o PF,我们还试验了头部周围初始化粒子数量的减少,n=10,记为HT + 10F,引入粒子滤波器显著提高了HT + 10F的身份保留分数(IDF1和IDEucl)。
![](http://imgq8.q578.com/ef/1115/32ff8fa53e9ff3e4.jpg)
将过滤器的数量进一步增加到100个可以获得最佳性能,然而,使用超过100个过滤器导致重复或不适度的传播,这是不可取的,我们去掉了重新识别模块,以了解其影响,表示为w/o ReID。
尽管颜色直方图是一个普通的图像描述符,但它大幅减少了身份切换的数量,并在身份保留度量(IDEucl, IDF1)中显示了优越的性能,我们还对对应IoU重要性和直方图匹配的α和β值进行了实验(公式7),我们设β为0.8,α为0.2,该构型记为HT + sReID,令人惊讶的是,我们观察到更多的身份切换和其他跟踪指标的性能略有下降,HeadHunter-T是我们的最终模型,它的表现超过了所有其他变体。
滤波器的选择:为了进一步证实我们对多模态滤波器的选择,我们用卡尔曼滤波运动模型替换了HeadHunter-T的粒子滤波器。卡尔曼滤波和粒子滤波都是递归状态估计算法,其中卡尔曼滤波假设系统是高斯噪声的线性系统,而粒子滤波的多模态后验分布使其能够对非线性系统的状态进行建模,我们用四态卡尔曼滤波器代替粒子滤波器来建模具有CVA的边界框的帧间位移。
这四种状态分别是x、y质心坐标、边界框的高度和纵横比,类似于SORT,表5总结了该跟踪器的性能,表示为HT + KF,在报告的所有跟踪指标方面,带有粒子滤波器的HeadHunter-T表现出优于其卡尔曼滤波器变体的性能,特别是,我们观察到IDEucl指标方面的重大改进。头部随行人位移的运动导致边界盒位置的非线性,虽然行人的运动通常是非线性的,但由于头部边界框的尺寸较小,这一问题更加严重,因此,使用多模态后验状态估计是必要的,以解决可感知的非线性运动的影响,我们认为这是使用粒子滤波器与卡尔曼滤波器相比性能提高的原因。
跨范式比较:我们比较了CroHD和MOTChallenge CVPR19数据集的公共序列上的行人和头部跟踪性能,相同的序列确保跟踪器在全身和头部边界框上进行评估和现场的行人一样。为了进行比较,我们在上述数据集上选择了已发表的最新方法,即Tracktor++、VIOU、DDTMA和HAM HI。我们根据MOTA、IDF1、MT(主要跟踪百分比)指标进行了比较,由于我们使用的对象检测器与其他方法不同,所以在性能指标之间进行直接比较是不公平的。