DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概
主要内容

Samangouei P, Kabkab M, Chellappa R, et al. Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

@article{samangouei2018defense-gan:,

title={Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.},

author={Samangouei, Pouya and Kabkab, Maya and Chellappa, Rama},

journal={arXiv: Computer Vision and Pattern Recognition},

year={2018}}

概

本文介绍了一种针对对抗样本的defense方法, 主要是利用GAN训练的生成器, 将样本$x$投影到干净数据集上$\hat{x}$.

主要内容

我们知道, GAN的损失函数到达最优时, $p_{data}=p_G$, 又倘若对抗样本的分布是脱离于$p_{data}$的, 则如果我们能将$x$投影到真实数据的分布$p_{data}$(如果最优也就是$p_G$), 则我们不就能找到一个防御方法了吗?

对于每一个样本, 首先初始化$R$个随机种子$z_0^{(1)}, \ldots, z_0^{(R)}$, 对每一个种子, 利用梯度下降($L$步)以求最小化

\[\tag{DGAN}
\min \quad \|G(z)-x\|_2^2,
\]

其中$G(z)$为利用训练样本训练的生成器.

得到$R$个点$z_*^{(1)},\ldots, z_*^{(R)}$, 设使得(DGAN)最小的为$z^*$, 以及$\hat{x} = G(z^*)$, 则$\hat{x}$就是我们要的, 样本$x$在普通样本数据中的投影. 将$\hat{x}$喂入网络, 判断其类别.

另外, 作者还在实验中说明, 可以直接用$\|G(z^*)-x\|_2^2 \frac{<}{>} \theta$ 来判断是否是对抗样本, 并计算AUC指标, 结果不错.

注: 这个方法, 利用梯度方法更新的难处在于, $x \rightarrow \hat{x}$这一过程, 包含了$L$步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

Mind the Box: $\ell_1$-APGD for Sparse Adversarial Attacks on Image Classifiers
目录概主要内容 Croce F. and Hein M. Mind the box: $\ell_1$-APGD for sparse adversarial attacks on image ...
Defending Adversarial Attacks by Correcting logits
目录概主要内容实验 Li Y., Xie L., Zhang Y., Zhang R., Wang Y., Tian Q., Defending Adversarial Attacks by C ...
Towards Deep Learning Models Resistant to Adversarial Attacks
目录概主要内容 Note Madry A, Makelov A, Schmidt L, et al. Towards Deep Learning Models Resistant to Adver ...
AT-GAN: A Generative Attack Model for Adversarial Transferring on Generative Adversarial Nets
目录概主要内容符号说明 Original Generator Transfer the Generator Wang X., He K., Guo C., Weinberger K., Hopc ...
论文阅读 | Real-Time Adversarial Attacks
摘要以前的对抗攻击关注于静态输入,这些方法对流输入的目标模型并不适用.攻击者只能通过观察过去样本点在剩余样本点中添加扰动. 这篇文章提出了针对于具有流输入的机器学习模型的实时对抗攻击. 1 介绍在 ...
KDD 2019放榜！录取率仅14%，强调可重现性
[导读]KDD 2019录取结果终于放榜了,今年Research和ADS两个 track共评审论文1900篇,其中Research track的录取率只有14%.今年也是KDD第一次采用双盲评审政策, ...
Distillation as a Defense to Adversarial Perturbations against Deep Neural Networks
目录概主要内容算法一些有趣的指标鲁棒性定义合格的抗干扰机制 Nicolas Papernot, Patrick McDaniel, Xi Wu, Somesh Jha, Ananthram ...
论文解读（GAN）《Generative Adversarial Networks》
Paper Information Title:<Generative Adversarial Networks>Authors:Ian J. Goodfellow, Jean Pouge ...
Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言本文主要思考的是 ...

随机推荐

使用 Addressables 来管理资源
使用 Addressables 来管理资源一.安装打开Package Manager,在Unity Technologies的目录下找到Addressables,更新或下载. 二.配置依次打开W ...
Docker学习（四）——Docker容器连接
Docker容器连接容器中可以运行一些网络应用,要让外部也可以访问这些应用,可以通过-P或-p参数来指定端口映射. 下面我们来实现通过端口连接到一个docker容器. 1.网络端口映射 ...
Siebel调用WebService
Siebel可以调用外部系统的接口,通过WebService的接入方式实现,所在的项目都是通过ESB,其他系统的接口都要经过ESB,由ESB提供WSDL文档,通过Siebel调用. 一.修改Tools ...
TSN（Time-Sensitive Networking）协议导读
前言上一个主题我们介绍了TSN的发展历史和协议族现状,它为建立统一的确定性网络传输基础设施提供了有力保障. TSN是一套协议标准,以保证确定性信息在标准以太网的不同场景下的顺利传输.TSN协议族本身 ...
【dva】如何监听异步请求是否完成(页面loading)
方案1.你可以在model里面操作在model里面的state里面声明一个变量state,默认是false,effect函数执行开始就将其改为true,然后等call()然后结束后又将其改为fals ...
aha
欢迎使用 MWeb MWeb 是专业的 Markdown 写作.记笔记.静态博客生成软件,目前已支持 Mac,iPad 和 iPhone.MWeb 有以下特色: 软件本身: 使用原生的 macOS 技 ...
删除空行（嵌套）（Power Query 之 M 语言）
数据源: "姓名""基数""个人比例""个人缴纳""公司比例""公司缴纳"&qu ...
JDK ThreadPoolExecutor核心原理与实践
一.内容概括本文内容主要围绕JDK中的ThreadPoolExecutor展开,首先描述了ThreadPoolExecutor的构造流程以及内部状态管理的机理,随后用大量篇幅深入源码探究了Threa ...
TPT Fusion平台升级，AUTOSAR及ViL测试功能重装上线
TPT简介 TPT是针对嵌入式系统基于模型的测试工具,特别是针对控制系统的软件功能测试.TPT支持众多业内主流的工具平台和测试环境,可以完成V模式要求所有阶段(MiL-SiL-PiL-HiL-ViL) ...
CF248A Cupboards 题解
Content 在一个走廊上有 $2n$ 扇门,排成两列分居左右.有个人很无聊,随意地开关了一些门,使得这些门看起来十分乱.现在请开关一些门,使得这些门恢复原来整齐的状态(要么都开.要么都关.要么 ...

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概

主要内容

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

随机推荐

热门专题