“Deep models under the GAN: information leakage from collaborative deep learning”阅读笔记
一、摘要
指出深度学习在机器学习场景下的优势,以及深度学习快速崛起的原因。随后点出研究者对于深度学习隐私问题的考虑。作者提出了一种强力的攻击方法,在其攻击下任何分布式、联邦式、或者中心化的深度学习方法都是脆弱的。这种攻击方法利用了学习过程中攻击者可以训练一个GAN的特性,从而能够模拟原始训练集的分布。
二、问题抽象
在众包/联邦机器学习场景下,任何一个参与多方训练的攻击者都能够获取多方训练集的隐私信息(推理攻击)。
三、使用工具
GAN
四、文章贡献
- 提出了一种新的利用GAN对分布式深度学习的攻击;首次将GAN运用到恶意场景;
- 相比于其他的信息提取方法,本文采用的方法更加通用,对卷积神经网络也有效;
- 提出了众包学习中欺骗的概念,让受害者泄露更多的精确隐私信息;
- 即使参数使用了差分隐私技术进行保护,攻击仍然有效。
指出google提出的联邦学习算法中仅将中心服务器考虑为敌手的情况是不安全的,任何一方参与训练的人都可能是敌手。
五、基本思路
1. 敌手模型
攻击者假扮为众包深度学习协议中的一个诚实参与方,执行协议的每一个上传下载步骤;
攻击者的目标是推断出有关一个标签(自己不拥有)的有意义的信息;
攻击者没有勾结中心服务器;
攻击者通过构造梯度影响其他参与方,并且可以欺骗其他参与方泄露更多信息;
2. 攻击方式
假设一个参与者(受害者)声明(声明自己拥有?)的标签为[a,b],攻击者A声明的标签为[b,c],也就是说b是他们共有的,而攻击者不知道关于类别a的任何信息。因此攻击者的目标就是尽可能多的推断出关于类别a中成员的信息。
攻击者就利用GAN来生成类似受害者的类别为a的样本,并给他们加上类别c的标签,然后再加入到分布式的学习过程中去。这样受害者需要投入更多的计算以区分类别a和类别c的样本,从而会泄露出比之前更多的关于类别a的信息。这样通过多轮迭代,根据GAN算法的性质,攻击者生成的c类别的分布将和类别a的分布趋于一致。从而达到攻击者的目的。
疑问:攻击者建立的GAN模型中的判别网络所需的类别为a的真实样本是如何获取的?(真实类别a样本应该只有受害者V拥有)
这个疑问可以用下面这张图帮助理解,也就是说攻击者不需要给判别器喂分类a的真实样本,因为从中心服务器PS下载下来的参数就是包含了受害者V已经喂过分类a真实样本的分类器(判别网络)的部分参数。所以可以理解成,攻击者本地的判别网络是交给拥有分类a的真实样本的受害者V来训练的。

六、结论
作者在本文提出的新型攻击方法比目前已知的模型反转攻击更加有效,并且目前没有好的防御方法,因此作者认为众包学习相比于传统的中心化的学习方式没有很强的替代意义。
七、未来工作
- 对本文提出的攻击进行防御,并且证明众包/联邦学习相比于传统的中心式的学习有较大的替代意义。
八、我的想法
- 本文是首次将GAN运用到了恶意场景,那么GAN是否有其他的恶意场景?
- 能否对本文的攻击方式进行防御?
“Deep models under the GAN: information leakage from collaborative deep learning”阅读笔记的更多相关文章
- Deep Models Under the GAN: Information Leakage from Collaborative Deep Learning
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1702.07464v3 [cs.CR] 14 Sep 2017 以下是对本文关键部分的摘抄翻译,详情请参见原文. ABSTR ...
- Deep Learning 阅读笔记:Convolutional Auto-Encoders 卷积神经网络的自编码表达
需要搭建一个比较复杂的CNN网络,希望通过预训练来提高CNN的表现. 上网找了一下,关于CAE(Convolutional Auto-Encoders)的文章还真是少,勉强只能找到一篇瑞士的文章. S ...
- Deep learning-based personality recognition from text posts of online social networks 阅读笔记
文章目录 一.摘要 二.模型过程 1.文本预处理 1.1 文本切分 1.2 文本统一 2. 基于统计的特征提取 2.1 提取特殊的语言统计特征 2.2 提取基于字典的语言特征 3. 基于深度学习的文本 ...
- 论文翻译——Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank
Abstract Semantic word spaces have been very useful but cannot express the meaning of longer phrases ...
- 论文解读(GMIM)《Deep Graph Clustering via Mutual Information Maximization and Mixture Model》
论文信息 论文标题:Deep Graph Clustering via Mutual Information Maximization and Mixture Model论文作者:Maedeh Ahm ...
- Deep Learning论文笔记之(八)Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
- Deep Learning of Graph Matching 阅读笔记
Deep Learning of Graph Matching 阅读笔记 CVPR2018的一篇文章,主要提出了一种利用深度神经网络实现端到端图匹配(Graph Matching)的方法. 该篇文章理 ...
- Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记
Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记 2018年12月03日 00: ...
- 最佳实践:深度学习用于自然语言处理(Deep Learning for NLP Best Practices) - 阅读笔记
https://www.wxnmh.com/thread-1528249.htm https://www.wxnmh.com/thread-1528251.htm https://www.wxnmh. ...
随机推荐
- input标签和fmt:formatDate 在jsp中同时使用引号解决办法
input标签和fmt:formatDate 在jsp中同时使用引号解决办法 使用input标签设置默认值value并格式化fmt时间格式处理 格式化前: <input type="d ...
- OpenStack☞HTTP协议
前言 超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议.所有的WWW文件都必须遵守这个标准 HTTP是一个基于TCP/IP通信协议 ...
- hdu 5744 Keep On Movin (2016多校第二场)
Keep On Movin Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Tot ...
- [转][ASP.NET Core 3框架揭秘] 跨平台开发体验: Windows [上篇]
微软在千禧年推出 .NET战略,并在两年后推出第一个版本的.NET Framework和IDE(Visual Studio.NET 2002,后来改名为Visual Studio),如果你是一个资深的 ...
- lrj 9.4.1 最长上升子序列 LIS
p275 d(i)是以Ai为结尾的最长上升子序列的长度 <算法竞赛入门经典-训练指南>p62 问题6 提供了一种优化到 O(nlogn)的方法. 文本中用g(i)表示d值为i的最小状态编号 ...
- poj 2996
提示:很烦很简单的国际象棋棋盘模拟,输入比较麻烦而已 输出时: 1.不论黑白,KQRBN P均是依次输出,强制大写,但不输出“P”,只输出其坐标 2.对白棋的位置,小行优先大行输出(行的数字越小则优先 ...
- H3C端口状态
- 被孟加拉题吊打的ACM考试
https://codeforces.com/gym/101864 题目并不难 B 考虑新加入的线段和之前线段有交的个数 总数-不交的,不交的:右端点在[l,r]左边,左端点在[l,r]右边的. 维护 ...
- C# 匹配可空变量
在 C# 7.0 的时候提供更好用的模式匹配方法,支持通过 is 直接转换对应的类,但是如果是尝试转换可空的对象,那么将会提示无法编译,或转换失败 在 C# 7.0 的 is 转换是十分好用的功能,例 ...
- AutoHotKey 用打码的快捷键
本文告诉大家如何使用 AutoHotKey 将 - 键默认输入的时候是下划线,因为使用下划线在写代码的时候是用在私有字段,而 - 很少使用 我打码经常需要使用下划线_而下划线需要按shift+- 两个 ...