论文题目:
Cross-dataset Training for Class Increasing Object Detection
论文地址:
https://arxiv.org/pdf/2001.04621.pdf
摘要
提出了一个概念简单、灵活和通用的目标检测中跨数据集训练的框架。给定两个或多个已标记的不同类别的数据集,跨数据集训练旨在不用标记所有数据集的所有类的情况下检测不同类的并集。交叉数据集训练现有数据集可用于检测具有单个模型的合并对象类,在工业应用中,目标类别通常按需增加。当使用交叉数据集训练时,只需要在新数据集上标记新类。在PASCAL VOC、COCO、widerface上进行实验。结果表明,我们的跨数据集训练方法与独立训练进行比较获得很好地性能。
1 简介
在实践中,新的检测类别需要不断添加,但这需要时间和人力资源,在本文中,使用称为交叉数据集训练的新概念解决这个问题,跨数据集训练旨在利用两个或更多用不同对象类标记的数据集来训练,并且可以在所有类上执行良好的模型,在图1中,人脸检测模型在仅用于执行人脸检测,以及一般在COCO上训练目标检测模型检测80个类别。通过交叉数据集训练FACE和COCO,我们的目标是一个模型,可以检测81个类,但不损失准确率。
对于跨数据集对象检测,简单地合并标签是不合理的,第一个原因是标签可能重复,因此有必要首先合并跨数据集的相同标签;第二个原因是正样本和负样本之间可能存在的冲突,例如,来自人脸检测的数据集负样本可能包含大量人体,考虑到这两个方面,提出了一种新的跨数据集训练方案,该方案由四个步骤组成:
1) 跨数据集合并重复标签;
2) 通过标签连接生成混合数据集
3) 跨数据集建立屏蔽关系
4) 使用此混合数据集训练检测器,根据屏蔽计算损失。
2 相关方法
相关方法都不是很相关,就不写了
3 交叉数据训练
3.1 检测基线
目标检测的跨数据集训练旨在检测跨不同现有数据集的所有类,并且无需额外的标记工作。考虑复制标签和跨数据集的可能冲突,使用retinanet作为基线,提出了一种新的跨数据集训练方案用于目标检测,关键组成部分包括:标签映射和数据集感知分类损失,提出的跨数据集训练方法的结构如图2所示。
3.2 标签映射
重复或语义一致跨数据集标签需要合并,数据集中的相似标签可以通过标签连接,使用数据集感知的focal loss。这两步骤可以概括为标签映射过程,旧标签将映射到一组新标签,其中仅保留唯一的标签,标签映射的一个简单示例如图3所示。假设我们有两个数据集标签分别为L1、L2、L3、L4、L5和M1、M2、M3。L1和M 3具有相同或相似的含义,因此可以映射到混合数据集中的相同新标签N2,通过这个标签映射过程,我们可以获得一个新的标签一致且无重复的数据集。