1 数据增强

1.1 相关方法

1.1.1 过采样

数据集中的小目标一般较少,会出现长尾问题,因此,训练时可以通过过采样方法来解决样本少的问题。这个方法是花费最少且最直接的方法。此外,通过改变过采样率,不仅是小目标,在中大型目标检测中也同样有效。

1.1.2 数据增强

可以将小目标贴到图片上的任意位置,以增加每个图像中小目标的数量,匹配的anchor数量也会随之增加。

1.2 相关论文

2 特征融合

2.1 RFBNet, ECCV 2018

不同尺度的特征融合,在扩大感受野的同时,也融合多个尺度的特征,增强了模型对小目标的检测。

RFBNetRFBNet

  • 多尺度卷积
  • 增加了扩张卷积,增加各层feature map的感受野,获得更多上下文信息。
  • 最后,concat后利用1*1卷积以减少通道数。

2.2 FPN CVPR 2017

FPNFPN

不同阶段的特征图对应的感受野不同,表达的信息抽象程度也不同。

  • 浅层感受野较小,比较适合检测小目标
  • 深层的特征图感受野大,适合大目标检测(要用来检测小目标,实则引入了背景的噪)

2.3 SSH ICCV 2017

SSHNetSSHNet

增大感受野,以获得更多的上下文信息。

2.4 利用上下文信息,或目标之间建立联系

对于人脸检测来说,在一张图片中,不会仅出现一个人脸,一定会有肩膀、身体这些信息,因此,PyramidBox: A Context-assisted Single Shot Face Detector提出人脸的上下文context信息,把小目标转为大目标来检测。

PyramidBoxPyramidBox

3 特别地,在两阶段中,使用ROI align更加准确

4 GAN

4.1 相关论文

5 提升图像分辨率

增大输入图像的分辨率来提升小目标检测的性能

6 更优的锚点设计