1 数据增强
1.1 相关方法
1.1.1 过采样
数据集中的小目标一般较少,会出现长尾问题,因此,训练时可以通过过采样方法来解决样本少的问题。这个方法是花费最少且最直接的方法。此外,通过改变过采样率,不仅是小目标,在中大型目标检测中也同样有效。
1.1.2 数据增强
可以将小目标贴到图片上的任意位置,以增加每个图像中小目标的数量,匹配的anchor数量也会随之增加。
1.2 相关论文
2 特征融合
2.1 RFBNet, ECCV 2018
不同尺度的特征融合,在扩大感受野的同时,也融合多个尺度的特征,增强了模型对小目标的检测。
- 多尺度卷积
- 增加了扩张卷积,增加各层feature map的感受野,获得更多上下文信息。
- 最后,concat后利用1*1卷积以减少通道数。
2.2 FPN CVPR 2017
不同阶段的特征图对应的感受野不同,表达的信息抽象程度也不同。
- 浅层感受野较小,比较适合检测小目标
- 深层的特征图感受野大,适合大目标检测(要用来检测小目标,实则引入了背景的噪)
2.3 SSH ICCV 2017
增大感受野,以获得更多的上下文信息。
2.4 利用上下文信息,或目标之间建立联系
对于人脸检测来说,在一张图片中,不会仅出现一个人脸,一定会有肩膀、身体这些信息,因此,PyramidBox: A Context-assisted Single Shot Face Detector提出人脸的上下文context信息,把小目标转为大目标来检测。
3 特别地,在两阶段中,使用ROI align更加准确
4 GAN
4.1 相关论文
- Perceptual Generative Adversarial Networks for Small Object Detection
利用GAN生成更好的小目标表示(该表示与大目标的特征接近,如上图b所示),并与高层表征融合,获得Super-Resolved Features
5 提升图像分辨率
增大输入图像的分辨率来提升小目标检测的性能