我们首先详细介绍了实验设置,并分析了HeadHunter在SCUTHEAD和CroHD两个数据集上的性能,对于HeadHunter的Faster-RCNN头部,我们使用了8个锚,其大小是通过在训练集中的真实边界框上执行K-means获得的,为了避免锚点重叠,锚点在四个金字塔层中被平均分割,锚点的步幅为max(16, s/d),其中s为锚框面积的平方根,d为比例因子,对于所有的实验,我们使用在线难例挖掘,有1000个建议框,批大小为512。
SCUT-Head 是一个大规模的头部检测数据集,由4405张图像和111,251个标注头部组成,分布在a部分和b部分,我们训练HeadHunter 20个周期,输入分辨率为训练集的中值图像分辨率(1000x600像素),初始学习率分别为第5、第10和第15个周期的0.01减半,为了进行公平的比较,我们只在这个数据集的训练集上训练HeadHunter,而不使用任何训练集pre-trained模型,我们在表2中总结了该数据集与其他头部检测器的定量比较,HeadHunter在精确度、召回率和F1分数上优于其他最先进的头部探测器。
![](http://imgq8.q578.com/ef/1115/aec29ef892e1f161.jpg)
CroHD 首先,我们以0.001的学习率对来自SCUT-HEAD数据集和CrowdHuman数据集的训练集图像组合进行了20个epoch的训练,对大规模图像数据集进行预训练,可以很好地描述变化,提高头部检测的鲁棒性,然后,我们使用ADAM优化器对CroHD训练集上的HeadHunter进行微调,共25个阶段,初始学习率为0.0001,学习率在第10和第20期分别下降了0.1倍。
消融 我们检查了HeadHunter的设计选择,即通过删除上下文模块和锚点选择策略的使用,表3总结了HeadHunter及其在CroHD上的变体的头部检测性能,我们将检测的最小置信度阈值设为0.5进行评估,W/O contt是指没有上下文模块的HeadHunter,我们进一步取消了中值锚点采样策略,并将其称为W/O Cont, mAn,我们还提供了基于CroHD上Resnet-50骨干的Faster-RCNN的基线性能,CroHD是我们构建HeadHunter的对象检测器,我们采用了与HeadHunter相同的训练策略,HeadHunter的所有变种都明显优于fast-rcnn,包含上下文模块和锚点初始化策略对头部检测也有显著影响。
![](http://imgq8.q578.com/ef/1115/6203204831b7f035.jpg)
6.2. HeadHunter-T
对于粒子过滤框架,我们对每个对象使用最多N=100个粒子,N个粒子均匀地放置在初始边界框周围,为了确保粒子不是不均匀地扩散并且足够清晰,我们从均匀分布中采样,其下限和上限分别为((x 1.5w, y 1.5h), (x + 1.5w, y + 1.5h),式中,x, y, w, h为初始边界框的质心、宽度和高度。对于基于颜色的重新识别,我们分别为H、S和V通道使用16、16和8个容器,其中使用亮度不变的Hue代替标准的Hue。表示IoU和颜色直方图匹配的重要性的α、β分别设为0.8和0.2,分别对应于公式7,如果轨迹在λage = 25帧的时间内保持不活跃,或者它的运动预测落在图像坐标之外,我们就会禁用它。
我们评估了CroHD上的三种最先进的跟踪器,即SORT, V-IOU和Tracktor,以与HeadHunter-T进行比较,我们选择了不需要任何跟踪特定训练的方法,这些方法的实现已经公开,并且在拥挤的MOTChallenge CVPR19基准测试上表现最好。
为了进行公平的比较,我们使用HeadHunter提供的头部检测进行所有实验,阈值设置为最小置信度0.6,SORT是一种利用卡尔曼滤波运动模型,将基于iou匹配的检测与匈牙利算法进行时间关联的在线跟踪器。VIOU将基于IOU匹配的IOU检测关联起来,利用可视化信息减少因漏检而导致的跟踪不一致,VIOU和SORT的参数设置是基于对CroHD训练集的微调,我们评估了Tracktor的两种变体,有和没有运动模型,Tracktor+MM表示带有摄像机运动补偿和CVA的非活动轨迹扩展的Tracktor,对于两个版本的Tracktor,我们设置了类似于HeadHunter的跟踪参数。