根据上述原因,对于COCO,我们使用三个纵横比为{1:2、1:1、2:1}的anchor并将尺度设置为{2,3,4}和{4,5.03,6.35}。对于PASCAL比率为{1:2,1:1,2:1},尺度为{4,5.03,6.35}作为基线设置。
人脸检测任务实验中有三条不同设置。相应的组合比率和尺寸为{1.25};{2, 3}}, { {1.25,2.44}; {2,3}和{0.5,1,2};{2, 3, 4} }
对于行人检测,比率和尺度设置为分别为{2.44}和{1,3}。最后,我们使用比率{1.25,2.44}和{2,3}的尺寸用于人脸行人的混合数据集训练,并采用{0.5、1、2}的比率和{2,3,4}的尺度用于PED-COCO和FACE-COCO-PED跨数据集训练。
4.2 结果和对比
比较了所提出的交叉训练和使用基线结果进行数据集训练的结果。考虑所有不同的跨数据集训练设置,包括人脸coco。使用相同的网络结构和相同的训练策略。评估COCO使用COCO通用目标检测任务的精度(AP),以及行人检测任务。对于widerface数据集,验证集有简单、中等和困难子集,大致对应于大、中、小脸。
4.2.1 基线
widerface:使用RetinaNet训练人脸检测器作为我们的基线。与原始配置不同,设置多个不同的设置以获得更好的性能,图5和表3显示了我们的结果。
COCO:首先使用原始COCO RetinaNet使用PyTorch生成结果。但是默认anchor尺寸不适合人脸检测。因此,我们认为为了公平比较需要将anchor的尺寸调整到同时适合人脸和coco,使用新的anchor尺寸重新训练了coco,表1显示了基线结果,使用新的anchor尺寸训练的结果非常接近原始的coco结果。
PASCAL VOC:PASCAL VOC数据集和COCO数据集进行交叉数据集训练,以验证我们对一般目标检测任务的想法,anchor比率与COCO设置相同,表5显示了我们基线的结果。
WIDER Pedestrian:我们首先使用的{2.44}纵横比,用于精确行人检测通过retinanet,为了与跨数据集训练更公平的比较,我们还添加多个anchor设置,与交叉数据集序列相同用作基线。
4.2.2 交叉数据训练
WIDER FACE with WIDER Pedestrian: 使用WIDER FACE和WIDER Pedestrian 的混合数据训练,表2显示达到了48.32的ap,几乎达到了基线48.37的水平,人脸检测任务,如图5也展示了相似的结果,结果清晰的表明混合数据训练策略在人脸检测和行人检测任务中几乎没有性能损失。
WIDER FACE with COCO:混合 WIDER FACE 和COCO 混合训练,使用resnet50达到了35.2的ap,和基线相比值损失了少许精度,对于MobileNetV2,在表1中显示了类似的结果,COCO minival的AP为29.5 vs 29.5。
WIDER Pedestrian with COCO:添加行人到COCO结果如表2。注意COCO中的人物类与行人相似,我们需要合并类。它得到了与原始结果相似的35.2 AP。此外,它在行人检测中具有更高的性能,因为COCO数据集也包含行人,这带来了更强的行人特征。
WIDER Pedestrian, COCO and WIDER FACE:使用WIDER Pedestrian, COCO 和 WIDER FACE一起合并训练,