阅读笔记 DeepFool: a simple and accurate method to fool deep neural networks

阅读笔记 DeepFool: a simple and accurate method to fool deep neural networks 初次编辑于2020.9.1 by EnEn 再次修改于2020.9.2 by EnEn

Abstract
Introduction
DeepFool for binary classifiers
DeepFool for multiclass classifiers
问题

初次编辑于2020.9.1 by EnEn
再次修改于2020.9.2 by EnEn

Abstract

DNN是最先进的图像分类器，但是遇到小的对抗扰动 就会判断错误，即使带有对抗扰动 的图片（从肉眼看）与原图片几乎没有区别。而基本上所有的模型都有这样的对抗扰动 ，因此研究对抗扰动 是有必要的。

提出Deep Fool 算法

计算（使一个网络判断错误的）扰动，
量化分类器的鲁棒性

Introduction

设能够 改变预测的结果(记为 $\hat k (\textbf x)$ )，且最小的扰动为 $r$
$\Delta(\textbf x; \hat k ):=\mathop{min}\limits_{\textbf r}||\textbf r||_2$ 且 $\hat k (\textbf x+\textbf r) \neq \hat k (\textbf x)$
其中， $\textbf x$ 为图片， $\hat k (\textbf x)$ 为预测的标签， $\Delta(\textbf x; \hat k )$ 为 $\hat k (\textbf x)$ 在 $\textbf x$ 处的鲁棒性

而分类器 $\hat k$ 的鲁棒性定义为
$\rho_{adv} (\hat k) = \mathbb{E}_\textbf x \frac{\Delta(\textbf x; \hat k )}{||\textbf x ||_2}$
其中， $\mathbb{E}_\textbf x$ 是图片 $\textbf x$ 的分布期望。
对抗扰动可以让我们了解分类器的特征

这篇文章的主要贡献有

简单且准确地计算和比较不同分类器对对抗扰动的鲁棒性。
我们提出的方法比目前已知的方法更稳定，更有效；利用对抗样本扩大训练集可以明显提高对对抗扰动的鲁棒性
我们提出的方法可以更好地理解为什么不准确（计算对抗扰动）的方法会带来不同的鲁棒性的结论，以及==它（We show that using imprecise approaches for the com- putation of adversarial perturbations could lead to dif- ferent and sometimes misleading conclusions about the robustness. Hence, our method provides a better un- derstanding of this intriguing phenomenon and of *its influence factors.==的影响因子

DeepFool for binary classifiers

$\hat k(\textbf x)=sign(f(\textbf x))$
其中， $f$ 是任意标量的图像分类器
$\mathbb R^n\rightarrow\mathbb R$
$\mathscr F\mathop{\Delta}\limits_{=}\{\textbf x : f(\textbf x)=0\}$ 定义为零点

首先， $f$ 是affine分类器 $f(\textbf x)=\omega ^\top \textbf x+b$

$f$ 在 $\textbf x_0$ 处的鲁棒性是 $\Delta(\textbf x_0; f)$ ，相当于 $\textbf x_0$ 到 $\mathscr F=\{\textbf x : \omega^\top \textbf x+b=0\}$ 的距离 如下图
线性二分类的对抗样本
那么改变分类器选择的最小扰动 $r$ 是 $\textbf x$ 在 $\mathscr F$ 上的垂直映射。
则 $\textbf r_*(\textbf x_0) := arg min ||\textbf r||_2$ 且 $sign(f(\textbf x_0+\textbf r))\neq$ $sign(\textbf f (x_0))= - \frac{f(\textbf x_0)}{||\omega||^2_2}\omega$
$f$ 是适用大部分实验的二分分类器，我们采用迭代的操作估计鲁棒性 $\Delta(\textbf x_0; f)$ 。特别的是，在每一个迭代中， $f$ 在当前点 $\textbf x_i$ 是线性化的。
$\mathop{arg min}\limits_{r_i}||r_i||_2$