An Introduction to Differential Privacy

原文链接：An Introduction to Differential Privacy

差分隐私算法可以允许分析人员执行良性的聚合分析，同时保证个人隐私得到切实的保护。、

背景
数据分析中的隐私保护技术已有数十年的历史，差分隐私算法是这一领域的最新技术。两个早期概念直接影响了差分隐私：
①最小查询集大小
②Dalenius的统计披露定义
最小查询集大小
旨在确保聚合查询的安全性，最小查询集大小是一种约束，只在确保聚合查询不会泄露有关个人的信息，给定某个配置的阈值量T，其确保每个聚合查询在至少有T个记录的数据集上进行，最小查询集大小会阻止针对少于T个记录的聚合查询。然而跟踪者攻击并不能被最小查询集大小所阻止，由于这些攻击最小查询集大小被认为不足以保护查询系统，所以，需要更好的、有保证的手段以确保隐私。
Dalenius的统计披露定义
1997年Tore Dalenius提出一个严格的数据隐私定义：攻击者在使用敏感数据集之前，对他们不认识的人应该一无所知。（虽然这种保证失败了，但它对理解为什么差分隐私被构造成现在的样子是很重要的）
差分隐私：
差分隐私差分隐私保证：攻击者能获取的个人数据几乎和他们从没有这个人记录的数据集中能获取的相差无几。这一保证足够强大，因为它符合显示世界——个人没有动机不参与数据集，因为不论自己在不在数据集中，该数据集的分析者都将得出关于该个人的相同的结论。由于其敏感的个人信息与系统的输出几乎完全不相关，因此用户可以确信处理其数据的组织不会侵犯他们的隐私。分析者几乎“无法获得个人信息”意味着他们被限制在关于任何个人的看法的微小变化中（“变化”是指使用数据集和使用相同的数据集减去任何一个人的记录之间的变化）。这种变化的范围由一个参数ε控制，对任何可能的结果，该参数设置了变化的边界。正式定义：算法A是-差分隐私的当且仅当 Pr[A(D) = x] ≤ e^ϵ * Pr[A(D') = x]，缺少任何一条记录的D被称为D'，比如缺少某个人的数据，符号e指的是数字常数注：上述定义只对随机算法有意义，给出确定性输出的算法都不适合差分隐私。差分隐私保证的主要吸引力在于其对分析者所能获取的个人信息量的限制，此外，它具有以下有用的属性：

可组合性：如果用保证程度分别为ε1和ε2的差分隐私来回应两个查询，则该对查询的差分隐私性等同于保证程度（ε1+ε2）。回想一下，较高的ε值意味着较弱的保证。
针对任意背景信息的强度：这种保证不以任何方式依赖于攻击者知道的背景信息。该属性是差分隐私强于早期的隐私保证（k-anonymity）的主要原因之一。
后期处理的安全性：对于差分隐私的结果，没有限制可以做什么——无论它与什么结合或者怎么被转换，它仍然是差分隐私的。

差分隐私算法是在算法内的关键点处添加噪声的随机算法。最简单的算法之一是拉普拉斯机制，该机制可以后期处理聚合查询的结果以使得它们差分私有。此外，存在着一些从根本上不同的算法，它们已经被证明可以保证差分隐私。几个值得探索的是私人乘法权重算法，乘法权重指数机制和DualQuery。

An Introduction to Differential Privacy的更多相关文章

Deep Learning with Differential Privacy
原文链接:Deep Learning with Differential Privacy abstract:新的机器学习算法,差分隐私框架下隐私成本的改良分析,使用非凸目标训练深度神经网络. 数学中最 ...
Introduction to Differential Equations,Michael E.Taylor,Page 3,4 注记
此文是对 [Introduction to Differential Equations,Michael E.Taylor] 第3页的一个注记.在该页中,作者给了微分方程$$\frac{dx}{dt} ...
Certified Robustness to Adversarial Examples with Differential Privacy
目录概主要内容 Differential Privacy insensitivity Lemma1 Proposition1 如何令网络为-DP in practice Lecuyer M, At ...
差分隐私（Differential Privacy）定义及其理解
1 前置知识本部分只对相关概念做服务于差分隐私介绍的简单介绍,并非细致全面的介绍. 1.1 随机化算法随机化算法指,对于特定输入,该算法的输出不是固定值,而是服从某一分布. 单纯形(simplex ...
论文总结(Frequent Itemsets Mining With Differential Privacy Over Large-Scale Data)
一.论文目标:将差分隐私和频繁项集挖掘结合,主要针对大规模数据. 二.论文的整体思路: 1)预处理阶段: 对于大的数据集,进行采样得到采样数据集并计算频繁项集,估计样本数据集最大长度限制,然后再缩小源 ...
Introduction to Differential Equations,Exercise 1.1,1.5,1.6,1.8,1.9,1.10
As noted,if $z=x+iy$,$x,y\in\mathbf{R}$,then $|z|=\sqrt{x^2+y^2}$ is equivalent to $|z|^2=z\overline ...
Note: Differentially Private Access Patterns for Searchable Symmetric Encryption
The Core Issues and Ideas of This Paper Problem Baseline Searchable Symmetric Encryption (SSE) could ...
Discrete.Differential.Geometry-An.Applied.Introduction(sig2013) 笔记
The author has a course on web: http://brickisland.net/DDGSpring2016/ It has more reading assignment ...
Functional mechanism: regression analysis under differential privacy_阅读报告
Functional mechanism: regression analysis under differential privacy 论文学习报告组员:裴建新赖妍菱周子玉 2020 ...

随机推荐

生成kafka内部请求与响应的接口文档
生成kafka内部请求与响应的接口文档 /** */ package com.code260.ss.kafka10demo; import java.io.File; import java.io.I ...
【Azure DevOps系列】什么是Azure DevOps
DevOps DevOps是一种重视"软件开发人员(Dev)"和"IT运维技术人员(Ops)"之间沟通合作的文化,它促进开发和运营团队之间的协作,以自动化和可重 ...
初期web渗透的学习路线
成长路线信息安全前端安全 web安全基础,书籍推荐 <网站入侵与脚本攻防修炼> 什么是web漏洞什么是sql注入漏洞什么是数据库什么是文件上传漏洞什么是跨站脚本攻击 < ...
感谢 Vue.js 拯救我这个前端渣渣，让 PowerJob 有了管理后台界面
本文适合有 Java 基础知识的人群作者:HelloGitHub-Salieri HelloGitHub 推出的<讲解开源项目>系列. 对于大部分非前端程序员来说,写网页无疑是一件非常痛 ...
如何校验内存数据的一致性，DynamicExpresso 算是帮上大忙了
一:背景 1. 讲故事记的在上一家公司做全内存项目的时候,因为一些关键表会在程序 startup 的时候全量灌入到内存中,但随着时间的推移,内存和数据库的同步偶尔会出现数据差异的情况,伴随着就是运营 ...
C# 监听值的变化
1.写一个监听值变化的类 public class MonitorValueChange { private Visibility myValue; public Visibility MyValue ...
团队作业4：第六篇Scrum冲刺博客（歪瑞古德小队）
目录一.Daily Scrum Meeting 1.1 会议照片 1.2 项目进展二.项目燃尽图三.签入记录 3.1 代码/文档签入记录 3.2 Code Review 记录 3.3 issue ...
rdf径向分布函数
1.rdf的in文件编写: 2.计算结果文件:
SpringBoot启动注解源码流程学习总结
ssm框架之springMVC拦截器
1拦截器概述 1.1什么是拦截器? springMVC中的拦截器(Interceptor)类似于servlet中的过滤器(Filter),它主要用于拦截用户请求并作相应的处理.例如通过拦截器可以进行权 ...

An Introduction to Differential Privacy

An Introduction to Differential Privacy的更多相关文章

随机推荐

热门专题