本文提出了对抗纹理的想法(AdvTexture),与基本补丁攻击不同对抗纹理可以生成任意大小,可以覆盖任意大小的不了,并且纹理的任何局部都有对抗性的效果。当衣服被对抗纹理覆盖是,摄像头捕捉到的每一个局部区域都可以攻击探测器,这成功解决了片段缺失的问题。
提出了一种两阶段生成方法:基于环形收割的可扩展生成攻击(TC-EGA)来制作广告纹理。
第一阶段,训练一个全卷积网络FCN作为生成器,通过采样随机潜变量作为输入来产生纹理(不同于GAN中传统的生成器架构,每一层都使用卷积运算)
第二阶段,利用环面裁剪技术TC搜索潜在变量的最佳局部模式,优化后,可以通过平铺局部模式来生成一个足够大的潜在变量。将其输入到FCN,得到AdvTexture。
方法
Adversarial Patch Generator
:整个布被AdvTexture覆盖
:被提取的patch。
假设遵循分布,因此当其对抗有效性更显著时,概率更高。使用能量函数来模拟这个分布:
配分函数:
由于配分函数的存在,很难直接从上进行采样,因此使用参数生成器来近似,其中,作为的分布,定义为:
为标准正态分布N(0,1)的概率密度函数(probability density function (PDF))为狄拉克函数。为了更精确的表达,调整最小化KL散度,借助DIM得到定理:
最小化等价于:
其中:
等式(3)中,第一项被称作Adversary Objective Function,最小化它可以提高生成补丁的对抗有效性。第二项被称作Information Objective Function,最小化它相当于最大化z和的互信息,需要不同的潜变量来生成不同的patch。
The Adversary Objective Function
通过对z和进行采样可以的到对抗目标函数':
检测器在接收图像时输出多个边界框,每个框都有一个置信度得分。如果置信度得分低于预先指定的阈值,则将过滤掉这些框。需要设置一个合适的能量函数,使能量降低导致人的探测器检测失败。选择箱体上置信度得分的期望作为能量函数U(̃τ)的一部分。然后最小化adv对象函数,就会降低方框的置信度,使方框更容易被过滤掉。
具体而言:在每一步中随机生成patch,并根据变换期望(EoT)对尺度、对比度、亮度和附加噪声进行随机化等一系列物理变换。
还加入了随机薄板自旋(TPS)变形作为额外的随机变换。然后,我们根据训练集中x图像上的预测框,将补丁随机地贴在人身上。
使用表示上述过程,得到修改后的图像,然后将其送入目标检测器。能量函数的定义为:
式中f为目标检测器预测框的置信度得分。
我们使用总方差(TV)损失的可微变化作为能量函数的另一部分,以鼓励补丁更平滑:
能量函数最终定义为:
流程图为:
The Information Objective function
在等式4中采用了辅助网络来增加z和,该辅助网络的结构为:
为了估计第一项,从N(0,1)中采样z,然后再每个训练步骤中通过G生成,为了估计第二项,我们保持并重新采样z。
Toroidal-Cropping-based Expandable Generative Attack(基于环面收割的可扩展生成攻击)
Stage One: Train an Expandable Generator
目标是训练一个生成器,使他可以通过随机z作为输入,生成任意大小的patch,关键是构造一个FCN赋予生成器平移不变的属性所用层都是零填充的卷积层,潜在变量是一个BxCxHxW张量。
使用FCN的原因:假设对抗纹理由全局生成器G和潜在变量Z产生,表示提取的块,中心位于整个纹理的(i,j)位置,形状为(w,h),可以看出是子发生器的输出。
在训练时,在形状B × C × Hmin × Wmin中采样一个小z,并在每个训练步骤中生成相应的patch。
之后,可以通过将任意H≥Hmin和W≥Wmin的z随机化来产生任意大小的不同纹理。
Stage Two: Find the Best Latent Pattern
引入了环面裁剪(TC)技术,其目的是优化局部模式作为一个单元,这样最终的潜在变量z可以通过平铺多个相同单元产生。
其中,可参数化为形状为B ×C ×L×L的张量,形状超参数为L,可视为拓扑上二维环面T2的展开平面.因此,任意形状的潜在变量可以通过递归的方式从裁剪(图6b),这可以看作是在环面上的裁剪。
我们称这种作物操作为。
在优化过程中,采用这种裁剪技术将潜在变量zsample随机抽取为形状为B × C × Hmin × Wmin的样本。
由于我这个阶段只考虑对手的有效性,所以我们通过zsample生成补丁,最小化对手的损失(Eq.(5))。
优化后,可以通过平铺zlocal产生一个任意大小的潜在变量。