DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概
主要内容

Samangouei P, Kabkab M, Chellappa R, et al. Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

@article{samangouei2018defense-gan:,

title={Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.},

author={Samangouei, Pouya and Kabkab, Maya and Chellappa, Rama},

journal={arXiv: Computer Vision and Pattern Recognition},

year={2018}}

概

本文介绍了一种针对对抗样本的defense方法, 主要是利用GAN训练的生成器, 将样本$x$投影到干净数据集上$\hat{x}$.

主要内容

我们知道, GAN的损失函数到达最优时, $p_{data}=p_G$, 又倘若对抗样本的分布是脱离于$p_{data}$的, 则如果我们能将$x$投影到真实数据的分布$p_{data}$(如果最优也就是$p_G$), 则我们不就能找到一个防御方法了吗?

对于每一个样本, 首先初始化$R$个随机种子$z_0^{(1)}, \ldots, z_0^{(R)}$, 对每一个种子, 利用梯度下降($L$步)以求最小化

\[\tag{DGAN}
\min \quad \|G(z)-x\|_2^2,
\]

其中$G(z)$为利用训练样本训练的生成器.

得到$R$个点$z_*^{(1)},\ldots, z_*^{(R)}$, 设使得(DGAN)最小的为$z^*$, 以及$\hat{x} = G(z^*)$, 则$\hat{x}$就是我们要的, 样本$x$在普通样本数据中的投影. 将$\hat{x}$喂入网络, 判断其类别.

另外, 作者还在实验中说明, 可以直接用$\|G(z^*)-x\|_2^2 \frac{<}{>} \theta$ 来判断是否是对抗样本, 并计算AUC指标, 结果不错.

注: 这个方法, 利用梯度方法更新的难处在于, $x \rightarrow \hat{x}$这一过程, 包含了$L$步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

Mind the Box: $\ell_1$-APGD for Sparse Adversarial Attacks on Image Classifiers
目录概主要内容 Croce F. and Hein M. Mind the box: $\ell_1$-APGD for sparse adversarial attacks on image ...
Defending Adversarial Attacks by Correcting logits
目录概主要内容实验 Li Y., Xie L., Zhang Y., Zhang R., Wang Y., Tian Q., Defending Adversarial Attacks by C ...
Towards Deep Learning Models Resistant to Adversarial Attacks
目录概主要内容 Note Madry A, Makelov A, Schmidt L, et al. Towards Deep Learning Models Resistant to Adver ...
AT-GAN: A Generative Attack Model for Adversarial Transferring on Generative Adversarial Nets
目录概主要内容符号说明 Original Generator Transfer the Generator Wang X., He K., Guo C., Weinberger K., Hopc ...
论文阅读 | Real-Time Adversarial Attacks
摘要以前的对抗攻击关注于静态输入,这些方法对流输入的目标模型并不适用.攻击者只能通过观察过去样本点在剩余样本点中添加扰动. 这篇文章提出了针对于具有流输入的机器学习模型的实时对抗攻击. 1 介绍在 ...
KDD 2019放榜！录取率仅14%，强调可重现性
[导读]KDD 2019录取结果终于放榜了,今年Research和ADS两个 track共评审论文1900篇,其中Research track的录取率只有14%.今年也是KDD第一次采用双盲评审政策, ...
Distillation as a Defense to Adversarial Perturbations against Deep Neural Networks
目录概主要内容算法一些有趣的指标鲁棒性定义合格的抗干扰机制 Nicolas Papernot, Patrick McDaniel, Xi Wu, Somesh Jha, Ananthram ...
论文解读（GAN）《Generative Adversarial Networks》
Paper Information Title:<Generative Adversarial Networks>Authors:Ian J. Goodfellow, Jean Pouge ...
Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言本文主要思考的是 ...

随机推荐

act
act的词源是do, 干着或干了的事情也可以叫act.抄全字典的话,抄的和看的都麻烦,在阅读中体会吧. act和action有啥区别?action: doing sth; act: n. action ...
java中类实现Serializable接口的原因
背景:一个java中的类只有实现了Serializable接口,它的对象才是可序列化的.如果要序列化某些类的对象,这些类就必须实现Serializable接口.Serializable是一个空接口,没 ...
Hibernate 总结（转）
JMX:Java Management Extensions.JCA: J2EE Contector ArchitectureJNDI: Java Namind and Directory Inter ...
hadoop基本命令（转）
在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用. 假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop. 启动与关闭启动HADOOP 进 ...
SpringMVC(1)：SpringMVC入门
一,MVC 概述 MVC:模型,视图,控制器,是一种软件设计规范,本质是将业务逻辑,数据,显示,分离的方式来编写代码:前后端分离 Model:数据模型,提供要展示的数据,一般我们都会把这两个分离开来. ...
Linux 双网卡绑定及Bridge
Linux 双网卡绑定及Bridge 阅读(5,202) 一:linux操作系统下双网卡绑定有七种模式.现在一般的企业都会使用双网卡接入,这样既能添加网络带宽,同时又能做相应的冗余,可以说是好处多多. ...
【Java多线程】线程池-ThreadPoolExecutor
ThreadPoolExecutor提供了四个构造方法: 我们以最后一个构造方法(参数最多的那个),对其参数进行解释: public ThreadPoolExecutor(int corePoolSi ...
springmvc中如何自定义类型转换器
package com.hope.utils;import org.springframework.core.convert.converter.Converter;import org.spring ...
Python格式处理
目录一.CVS表格二.xml 三.json 四.yml 五.配置文件六.数据库一.CVS表格 import csv villains = [ ['Doctor', 'No'], ...
Spring事务什么时候会失效？
面试官:Spring事务什么时候会失效? 应聘者: 访问权限问题方法用final修饰未被Spring管理错误的传播特性自己吞了异常手动抛了别的异常自定义了回滚异常方法内部调用 1.访问权 ...

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概

主要内容

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

随机推荐

热门专题