腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来的桥梁
数据孤岛、数据隐私以及数据安全,是目前人工智能和云计算在大规模产业化应用过程中绕不开的“三座大山”。
“联邦学习”作为新一代的人工智能算法,能在数据不出本地的情况下,实现共同建模,提升AI模型的效果,从而保证数据隐私安全,突破数据孤岛和小数据的限制,这无疑成为了跨越“三座大山”的途径之一。因此,作为联邦学习全球首个工业级开源项目,FATE也受到了各方关注,开发者们对加入社区建设纷纷表示期待。(FATE开源社区地址:https://github.com/FederatedAI/FATE)
而在贡献者激励机制推出以后,FATE开源社区迎来了首位一级贡献者——来自腾讯云的刘洋。联邦学习怎样赋能行业数据安全?隐私保护从业者怎样评价FATE?刘洋博士在采访中表达了自己的看法。

数据运算提效70% 加速企业应用落地
博士毕业于澳大利亚国立大学的刘洋,同时是腾讯云的高级研究员,负责腾讯神盾沙箱的隐私保护算法部分。刘洋表示,因自身从业领域的缘故,从年初就开始密切关注着“联邦学习”。
也因此,FATE进入了其视野,受到了刘洋及腾讯云团队的重点关注。在对FATE进行深入了解后,刘洋认为腾讯神盾沙箱打造的隐私安全+分布式学习的理念,与FATE要解决的“数据安全”“数据隐私”“数据合规”三大问题不谋而合,并逐步开始使用FATE满足神盾沙箱的功能需求。

刘洋表示,经过长期接触后,对FATE的逻辑回归和XGBoost算法流十分认同,因此也开始加入FATE开源社区建设,提出了优化建议——利用对称的仿射密码替代Paillier密码,将训练时间提升70%以上,从而给同态运算“减负”。未来合作企业在应用优化过后的FATE版本时,可以有效降低数据运算的时间成本,提升企业在AI时代的技术竞争能力。
行业负重前行 数据安全迫在眉睫
AI应用场景中,将多方数据中心式合并处理的传统合作方式,存在着严重的隐私泄露问题,这一症结甚至成为了企业大规模应用AI的关键阻碍。
在刘洋看来,破局关键仍在于数据安全问题的解决,即数据privacy和utility的折衷问题。具体来说,数据要想安全的从孤岛分享出去,必须经历某些“蒙面”操作:通过密码学工具将有效数据转换成乱码,privacy保住了,但密钥在谁手中,极大的影响数据的utility;用噪声混淆原始数据也可以,例如差分隐私,噪声越大,越保证privacy,但使用者拿到数据发挥的utility越低。怎样在privacy和utility中寻求一条折衷之路,是数据安全流通的关键问题之一。
未来理想的状态是,任何数据使用者能够在自由流动和聚合的分布式数据之上,进行高效的数据挖掘操作,而丝毫感觉不到隐私保护的羁绊。在MPC(Multi-party Computation,多方安全计算)领域,目前行业还停留在混淆电路、可信计算等解决方案,虽然支持的计算任务具有一般性,但需要额外的硬件支持,学习成本较高,阻碍了规模化应用的同时,也不利于安全数据联盟的形成。
而联邦学习在具有普适性的联邦框架中,针对每一种或每一类机器学习算法进行订制化的隐私保护改造,使它们的使用无异于经典的中心式机器学习模型。相比之下,联邦学习在稳住成本的基础上,确保了易用性。刘洋称,对于企业而言,联邦学习提供的解决方案更具吸引力;对于行业而言,更便捷的操作将吸引更多开发人员的投入,从而推进安全数据联盟的构建。
FATE生态×腾讯云 数据安全未来可期
今年5月初起,FATE和腾讯云神盾沙箱就开始进行业务往来和技术交流,目前神盾沙箱的核心计算模块由FATE提供。在搭建平台过程中,双方紧密合作。刘洋在采访中表示,团队在使用FATE框架、算法时,会将有效建议贡献到FATE开源项目中,参与开源社区建设。

这种带有“互助互惠,开源共筑”特色的合作形式,在促进了神盾沙箱的产品打磨和FATE项目的完善的同时,也给其他技术项目或团队提供了很好的样板示范——以开放的姿态拥抱新的技术,不仅于自身有利,也将助推整个行业的发展。
在刘洋的设想中,未来两者可以在提升技术影响力和业务落地等方面进行更深层次的协作,例如合作发表重要论文、提交专利和联手接手内外部实际业务,形成“学术”“业界”两开花的美好局面。
随着越来越多贡献者加入FATE理论标准与行业应用的建设,FATE势必会迎来更广阔的前景。对此,刘洋表示,神盾沙箱和FATE的联手将会加速数据安全的扎根与生长,在数据孤岛之上构建起安全数据联盟的未来可期。
腾讯数据安全专家谈联邦学习开源项目FATE:通往隐私保护理想未来的桥梁的更多相关文章
- 联邦学习开源框架FATE助力腾讯神盾沙箱,携手打造数据安全合作生态
近日,微众银行联邦学习FATE开源社区迎来了两位新贡献者——来自腾讯的刘洋及秦姝琦,作为云计算安全领域的专家,两位为FATE构造了新的功能点,并在Github上提交修复了相关漏洞.(Github项目地 ...
- 转: 学习开源项目的若干建议(infoq)
转: http://www.infoq.com/cn/news/2014/04/learn-open-source 学习开源项目的若干建议 作者 崔康 发布于 2014年4月11日 | 注意:GTLC ...
- 华为章宇:如何学习开源项目及Ceph的浅析
转自http://www.csdn.net/article/2014-04-10/2819247-how-to-learn-opensouce-project-&-ceph 摘要:开源技术的学 ...
- MindSpore联邦学习框架解决行业级难题
内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲<MindSpore联邦学习框架解决隐私合规下的数据孤岛问题>. 演讲嘉宾:华为MindSpore联邦学习工程 ...
- 开源项目live555学习心得
推荐:伊朗美女找丈夫比找工作难女人婚前一定要看清三件事 × 登录注册 疯狂少男-IT技术的博客 http://blog.sina.com.cn/crazyboyzhaolei [订阅][手机订 ...
- 转:开源项目学习方法ABC
文章来自于 http://yizhaolingyan.net/?p=123#comment-207 学习各种开源项目,已经成为很多朋友不可回避的工作内容了.笔者本人也是如此.在接触并学习了若干个开源项 ...
- Github上关于iOS的各种开源项目集合2(强烈建议大家收藏,查看,总有一款你需要)
资源list:Github上关于大数据的开源项目.论文等合集 Awesome Big Data A curated list of awesome big data frameworks, resou ...
- 不想加班开发管理后台了,试试这个 Java 开源项目吧!
本文适合有 Java 基础并了解 SpringBoot 框架的同学 本文作者:HelloGitHub-嘉文 这里是 HelloGitHub 推出的<讲解开源项目>系列,今天给大家带来一款开 ...
- Apache Pulsar 在腾讯 Angel PowerFL 联邦学习平台上的实践
腾讯 Angel PowerFL 联邦学习平台 联邦学习作为新一代人工智能基础技术,通过解决数据隐私与数据孤岛问题,重塑金融.医疗.城市安防等领域. 腾讯 Angel PowerFL 联邦学习平台构建 ...
随机推荐
- LeetCode.1184-公交车站之间的距离(Distance Between Bus Stops)
这是小川的第次更新,第篇原创 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第265题(顺位题号是1184).公交车有n个从0到n-1的车站,形成一个圆圈.我们知道所有相邻车站对之间的 ...
- C#对IQueryable<T>、IEnumerable<T>的扩展方法
#region IQueryable<T>的扩展方法 #region 根据第三方条件是否为真是否执行指定条件的查询 /// <summary> /// 根据第三方条件是否为真是 ...
- 2019icpc银川网络赛
外面吵得风生水起,我校平静地在打比赛,丝毫不知道这次比赛的题目就是把2018银川邀请赛的题照搬过来了QAQ,主办方真牛逼.. A Maximum(思维) 题意:维护一个栈,支持入栈和出栈操作,并计算每 ...
- [转帖]InfluxDB 1.2.0安装及新旧版本的注意事项
InfluxDB 1.2.0安装及新旧版本的注意事项 http://haibing.org/245?zwlqby=npztq3 挺好的文章 很好的解决了 上一个文档里面 关于 web admin 的问 ...
- spring boot 使用elasticsearch
在文章开始之前我们先来介绍一下elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎. 查询 : Elasticsearch 允许执行和合并多种类型的搜索 — 结构化.非 ...
- linux 软连接和 硬链接的区别
Linux软链接硬链接的区别 ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同步的链接.当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下 ...
- 洛谷P3353 【在你窗外闪耀的星星】
题目真的好甜呢QwQ 冲着这题面也要来做 满分解法:线段树 我们暴力地把所有点建成一颗线段数 接着在从1到maxx里每个长度为 w的区间中执行区间求和 其实单点修改都不需要,可以在输入的时候统计出每个 ...
- Python学习笔记:运算符
逻辑运算符: + 加 - 减 * 乘 / 除 % 取模-返回除法的余数 ** 幂-返回x的y次方 // 整除 比较运算符: == 等于-比较对象是否相等 != ...
- 刨根究底字符编码之十——Unicode字符集的编码方式以及码点、码元
Unicode字符集的编码方式以及码点.码元 一.字符编码方式CEF的选择 1. 由于Unicode字符集非常大,有些字符的编号(码点值)需要两个或两个以上字节来表示,而要对这样的编号进行编码,也必须 ...
- PHP 协程:Go + Chan + Defer
Swoole4为PHP语言提供了强大的CSP协程编程模式.底层提供了3个关键词,可以方便地实现各类功能. Swoole4提供的PHP协程语法借鉴自Golang,在此向GO开发组致敬 PHP+Swool ...