论文题目A Comparison of Super-Resolution and Nearest Neighbors Interpolation Applied to Object Detection on Satellite Data
0.摘要
本文也是尝试将分类或目标检测任务与超分辨率(Super-Resolution)的预处理阶段相结合,在相对小的目标上提高精度。他也是通过和最小邻近插值( Nearest Neighbors ,NN)相比较,得到的结论是SR生成的放大图像比NN生成的图像更好看,但目标检测网络在精度上的差别很小。
作者使用的是xView Challenge Dataset,是一个拥有带有标记对象的卫星捕获图像的数据集.基于yolov2模型,使用的SR方法是MDSR。
1.实验过程
汽车大约由一个13 × 7像素的网格表示,而整个图片大约为4000*3000像素,因此xView数据集很适合来验证一个检测器的应对小目标能力。图2是分别用mdsr和nn进行4倍放大的图片,从图2中我们可以看出,MDSR比NN插值方法产生了更清晰的图片。
因为yolov2的输入最后会调整到416*416上,而输入的图片很大压缩率就会很高,所以作者对之前的图片进行了两次切割:第一次先从图像中连续切割208x208的小图片,图片之间的重叠为50个像素。然后这些图片被送到放大阶段,每个图片放大4倍,产生一个832x832的图像。
第二次是将这项图片再切割成416*416大小的图片,图片之间的重叠也是50个像素,这样就获得了很多高分辨率的原始输入。
为了消除重叠,作者引入了面积的交并比来控制输出框的数量。
3.实验结果
MDSR和NN升级方法有几乎没有任何区别,NNx4优于MDSRx4 0.02%个AP。作者怀疑网络很可能是根据这些小对象中有限的几何形状提取的特征,而不是通过先进的上采样方法(如MDSR)来获得何独特特征。经过我的实验发现,图像的效果和提取特征关联度不大。sr无论是放大图像或特征都效果不显著,和普通的nn差不多。