2.基于梯度的攻击—

　　FGSM原论文地址：https://arxiv.org/abs/1412.6572

　　1.FGSM的原理

　　　　FGSM的全称是Fast Gradient Sign Method(快速梯度下降法），在白盒环境下，通过求出模型对输入的导数，然后用符号函数得到其具体的梯度方向，接着乘以一个步长，得到的“扰动”加在原来的输入上就得到了在FGSM攻击下的样本。

　　　　FGSM的攻击表达如下：

　　　　那么为什么这样做有攻击效果呢？就结果而言，攻击成功就是模型分类错误，就模型而言，就是加了扰动的样本使得模型的loss增大。而所有基于梯度的攻击方法都是基于让loss增大这一点来做的。可以仔细回忆一下，在神经网络的反向传播当中，我们在训练过程时就是沿着梯度方向来更新更新w，b的值。这样做可以使得网络往loss减小的方向收敛。

那么现在我们既然是要使得loss增大，而模型的网络系数又固定不变，唯一可以改变的就是输入，因此我们就利用loss对输入求导从而“更新”这个输入。(当然，肯定有人问，神经网络在训练的时候是多次更新参数，这个为什么仅仅更新一次呢？主要因为我们希望产生对抗样本的速度更快，毕竟名字里就有“fast”，当然了，多次迭代的攻击也有，后来的PGD（又叫I-FGSM)以及MIM都是更新很多次，虽然攻击的效果很好，但是速度就慢很多了）

　　　　为什么不直接使用导数，而要用符号函数求得其方向？这个问题我也一直半知半解，我觉得应该是如下两个原因：1.FGSM是典型的无穷范数攻击，那么我们在限制扰动程度的时候，只需要使得最大的扰动的绝对值不超过某个阀值即可。而我们对输入的梯度，对于大于阀值的部分我们直接clip到阀值，对于小于阀值的部分，既然对于每个像素扰动方向只有+-两个方向，而现在方向已经定了，那么为什么不让其扰动的程度尽量大呢？因此对于小于阀值的部分我们就直接给其提升到阀值，这样一来，相当于我们给梯度加了一个符号函数了。2.由于FGSM这个求导更新只进行一次，如果直接按值更新的话，可能生成的扰动改变就很小，无法达到攻击的目的，因此我们只需要知道这个扰动大概的方向，至于扰动多少我们就可以自己来设定了~~（欢迎讨论）

　　2.FGSM的进一步解释

　　　　FGSM的原作者在论文中提到，神经网络之所以会受到FGSM的攻击是因为：1.扰动造成的影响在神经网络当中会像滚雪球一样越来越大，对于线性模型越是如此。而目前神经网络中倾向于使用Relu这种类线性的激活函数，使得网络整体趋近于线性。2.输入的维度越大，模型越容易受到攻击。（下面两张图是原来在实验室讲PPT时做的图就直接拿过来用了，有需要的自取，链接：https://pan.baidu.com/s/1sYH0cZTLZ_JBHt_0S26NPA，提取码：xhjz）

上图的解释其实也是原论文中的解释，虽然这里是直接使用梯度，没有用符号函数处理过，但道理是一样的。

可以看到，对于一个简单的线性分类器，loss对于x的导数取符号函数后即w，即使每个特征仅仅改变0.5，分类器对x的分类结果由以0.9526的置信概率判断为0变成以0.88的置信概率判断为1.　　　

　　3.FGSM的代码实现（pytorch)

 class FGSM(nn.Module):

     def __init__(self,model):

         super().__init__()

         self.model=model#必须是pytorch的model

         self.device=torch.device("cuda" if (torch.cuda.is_available()) else "cpu")

     def generate(self,x,**params):

         self.parse_params(**params)

         labels=self.y

         if self.rand_init:

             x_new = x + torch.Tensor(np.random.uniform(-self.eps, self.eps, x.shape)).type_as(x).cuda()

         # get the gradient of x

         x_new=Variable(x_new,requires_grad=True)

         loss_func = nn.CrossEntropyLoss()

         preds = self.model(x_new)

         if self.flag_target:

             loss = -loss_func(preds, labels)

         else:

             loss = loss_func(preds, labels)

         self.model.zero_grad()

         loss.backward()

         grad = x_new.grad.cpu().detach().numpy()

         # get the pertubation of an iter_eps

         if self.ord==np.inf:

             grad =np.sign(grad)

         else:

             tmp = grad.reshape(grad.shape[0], -1)

             norm = 1e-12 + np.linalg.norm(tmp, ord=self.ord, axis=1, keepdims=False).reshape(-1, 1, 1, 1)

             # 选择更小的扰动

             grad=grad/norm

         pertubation = grad*self.eps

         adv_x = x.cpu().detach().numpy() + pertubation

         adv_x=np.clip(adv_x,self.clip_min,self.clip_max)

         return adv_x

     def parse_params(self,eps=0.3,ord=np.inf,clip_min=0.0,clip_max=1.0,

                      y=None,rand_init=False,flag_target=False):

         self.eps=eps

         self.ord=ord

         self.clip_min=clip_min

         self.clip_max=clip_max

         self.y=y

         self.rand_init=rand_init

         self.model.to(self.device)

         self.flag_target=flag_target

其实FGSM的实现还不是很难~~各个工具包都有实现，可以参考自己实现一下，值得说明的是rand_init和flag_target两个参数：

　　rand_init为True时，模型给x求导之前会为其添加一个随机噪声（噪声类型可以自己指定），据说这样效果过会好一点。
flag_target为False时，即为无目标攻击，此时的loss是loss_func(preds, labels)，这里的lables是正确的lables,当flag_target为False时，即为有目标攻击，此时的loss是-loss_func(preds, labels)，这里的lables是指定的label，故loss前面加负号，这个时候更新x,相当于正常的梯度下降了，因为，这个时候loss_func(preds, labels)是往我们希望的方向优化的。

最后补充一句就是，由于产生的对抗样本可能会在（0，1）这个范围之外，因此需要对x clip至（0，1）。

2.基于梯度的攻击——FGSM的更多相关文章

1 基于梯度的攻击——FGSM
FGSM原论文地址:https://arxiv.org/abs/1412.6572 1.FGSM的原理 FGSM的全称是Fast Gradient Sign Method(快速梯度下降法),在白盒环境 ...
4.基于梯度的攻击——MIM
MIM攻击原论文地址——https://arxiv.org/pdf/1710.06081.pdf 1.MIM攻击的原理 MIM攻击全称是 Momentum Iterative Method,其实这也是 ...
3 基于梯度的攻击——MIM
MIM攻击原论文地址——https://arxiv.org/pdf/1710.06081.pdf 1.MIM攻击的原理 MIM攻击全称是 Momentum Iterative Method,其实这也是 ...
3.基于梯度的攻击——PGD
PGD攻击原论文地址——https://arxiv.org/pdf/1706.06083.pdf 1.PGD攻击的原理 PGD(Project Gradient Descent)攻击是一种迭代攻击,可 ...
2 基于梯度的攻击——PGD
PGD攻击原论文地址——https://arxiv.org/pdf/1706.06083.pdf 1.PGD攻击的原理 PGD(Project Gradient Descent)攻击是一种迭代攻击,可 ...
5.基于优化的攻击——CW
CW攻击原论文地址——https://arxiv.org/pdf/1608.04644.pdf 1.CW攻击的原理 CW攻击是一种基于优化的攻击,攻击的名称是两个作者的首字母.首先还是贴出攻击算法的公 ...
基于梯度场和Hessian特征值分别获得图像的方向场
一.我们想要求的方向场的定义为: 对于任意一点(x,y),该点的方向可以定义为其所在脊线(或谷线)位置的切线方向与水平轴之间的夹角: 将一条直线顺时针或逆时针旋转 180°,直线的方向保持不变. 因 ...
4 基于优化的攻击——CW
CW攻击原论文地址——https://arxiv.org/pdf/1608.04644.pdf 1.CW攻击的原理 CW攻击是一种基于优化的攻击,攻击的名称是两个作者的首字母.首先还是贴出攻击算法的公 ...
C / C ++ 基于梯度下降法的线性回归法（适用于机器学习）
写在前面的话: 在第一学期做项目的时候用到过相应的知识,觉得挺有趣的,就记录整理了下来,基于C/C++语言原贴地址:https://helloacm.com/cc-linear-regression ...

随机推荐

HTML5特性之AJAX跨域
js跨域问题一般会考虑iframe.jsonp. 后端语言设置响应头:header('Access-Control-Allow-Origin:*),*号表示允许所有域名,可以将*号改为指定允许的访问域 ...
C++/CLI泛型应用
2019年01月16日, QQ群友不知道要折腾什么, 提出了以下问题: 样例代码中的是C#语言写的, 翻译成C++/CLI就不会了, 于是我试着谢了一下, 发现可以实现, 于是就贴出来与大家分享, 源 ...
CentOS 7安装MongoDB
1 下载安装包 wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-3.2.4.tgz 2 解压 .tgz 3 将解压包 ...
帝国cms打开慢
发现有个站(http://www.953239.com/)打开很慢,改了php版本后,快了一倍
B-树（B树）详解
具体讲解之前,有一点,再次强调下:B-树,即为B树.因为B树的原英文名称为B-tree,而国内很多人喜欢把B-tree译作B-树,其实,这是个非常不好的直译,很容易让人产生误解.如人们可能会以为B-树 ...
集成学习—boosting和bagging
集成~bagging~权值~组合~抽样~样例~基本~并行一.简介集成学习通过构建并结合多个学习器来完成学习任务,常可获得比单一学习器显著优越的泛化性能根据个体学习器的生成方式,目前的集成学习方法 ...
Jenkins-在windows上安装及其部署
Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件的持续集成变成可能.其主要功能:1.持续的软件版本发布/测试项目. ...
[物理学与PDEs]第2章习题2 质量力有势时的能量方程
试证明: 如果质量力有势, 即存在 $\phi$ 使 ${\bf F}=-\n \phi$, 那么理想流体的能量守恒方程的微分形式可写为 $$\bex \cfrac{\rd}{\rd t}\sex{e ...
Educational Codeforces Round 52 (Rated for Div. 2)
题目链接 A. Vasya and Chocolate 题意已知钱,价格,赠送规则求最多获得巧克力数思路常规算即可代码 #include <bits/stdc++.h> #defin ...
【先验知识归纳】Flask快速入门
本文参考:快速入门 - Flask 0.10.1 文档路由 Flask使用route修饰器来关联URL与程序函数: @app.route('/') def hello_world(): return ...

2.基于梯度的攻击——FGSM

2.基于梯度的攻击——FGSM的更多相关文章

随机推荐

热门专题