Bootstrap

数据预处理(常用增强技术)

参考文献:Data Augmentation | How to use Deep Learning when you have Limited Data
author网址:https://thatbrguy.github.io/
参考网址1:http://baijiahao.baidu.com/s?id=1599775088482026500&wfr=spider&for=pc
参考网址2:https://www.jianshu.com/p/99450dbdadcf

  1. 翻转:水平翻转,垂直翻转
  2. 旋转:在旋转之后,图像大小(维度)可能会改变。如果是正方型图像,旋转任意90度之后图像的尺寸会被保留。如果图像是长方形,旋转180度之后图像尺寸也会保留。 但用更小的角度旋转图像,将会改变最终图像的尺寸。
  3. 缩放: 图像可以被放大或缩小。图像放大后,大多数图像处理架构会按照原始尺寸对放大后的图像进行裁切。图像缩小后,会减小图像尺寸,这使我们不得不对图像边界之外的东西做出假设。
  4. 裁剪:随机从原始图像中采样一部分。然后将这部分图像调整为原始图像大小。这个方法更流行的叫法是随机裁剪。
  5. 平移:是将图像沿X或Y方向(或者同时沿2个方向)移动。这一数据增强方法非常有用,因为大多数对象有可能分布在图像的任何地方。这迫使你的卷积神经网络需要看到所有地方。
  6. 高斯噪声:过拟合(Overfitting)经常会发生在神经网络试图学习高频特征(即非常频繁出现的无意义模式)的时候,而学习这些高频特征对模型提升没什么帮助。如何处理?
    一个是采用具有零均值特性的高斯噪声,它实质上在所有频率上都能产生数据点,可以有效的使高频特征失真,减弱其对模型的影响。但这也意味着低频的成分(通常是你关心的特征)同时也会受到影响,但是神经网络能够通过学习来忽略那些影响。事实证明,通过添加适量的噪声能够有效提升神经网络的学习能力。
    一个是椒盐噪声,它以随机的白色和黑色像素点呈现并铺满整个图片。这种方式对图像产生的作用和添加高斯噪声产生的作用是一样的,只是效果相对较弱。

填充边界方式:

  1. 常量填充:最简单的插值方法是用某个常量值填充未知区域。这可能不适用于自然图像, 但可以用于在单色背景下拍摄的图像。
  2. 边缘扩展:将图像边缘的值扩展到边界以外。
  3. 反射:图像像素值沿图像边界进行反射。这种方法对于包含树木、山脉等的连续或自然背景是有用的。
  4. 对称:此方法类似于反射,除了在反射边界上进行边缘像素拷贝。通常,反射和对称可以交替使用,但在处理非常小的图像或图案时,差异将是可见的。
  5. 包裹:在超出图像边界的部分重复填充图像,仿佛在进行图像平铺。这种方法不像其他的那样普遍使用, 因为它对很多场景都没有意义。
    除此之外,你还可以设计自己的方法来处理未定义的空间, 但通常以上这些方法对大多数分类问题都有很好的效果。
;