Bootstrap

使用GAN来进行CV数据增强(一)

一.论文

二.论文概述

  • 使用原始数据训练DCGAN,然后根据得到的模型产生新的数据作为扩充数据用于训练
  • 设计LSRO(label smoothing regularization for outliers)损失函数,将DCGAN产生的数据的label分布标为均匀分布,比如为3分类,其lable为[1/3,1/3,1/3].
  • 加入了DCGAN产生的扩充数据,并使用LSRO后,性能在Market-1501, CUHK03, DukeMTMC-reID上能分别提升4.37%, 1.6%, 2.46%

三.论文细节

1) DCGAN[1]
  • PART1:产生器,100维的随机向量,扩充到4*4*16;之后继续扩大,通过5个反卷积,5*5的卷积核并且stride为2.额外的,一个可选的反卷积核使用的是5*5大小且stride为1的卷积核。最后出来的是128*128*3的图片。
  • PART2:生成器使用的是5个卷积层.卷积核大小也是5*5,stride为2
  • backbone用的是resne
;