重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障
随着包括零售、制造、金融等多行业数字化转型加速推进,数据的价值正在被越来越多的企业广泛认知,国家亦出台多项政策,明确数据要素的基础性、战略性地位,要求加强数据资源整合、应用于安全管理,提升数据资源价值。
同时,面对持续扩大的安全威胁维度和行业监管要求,企业对数据安全的防护力度要求也在不断加码,亟需一套完整的数据安全产品,实现不同场景应对的数据安全保护。
响应国家及市场要求,近日,阿里云数据中台产品矩阵之一的隐私增强计算产品DataTrust正式对外发布。
记者了解到,DataTrust依托阿里云底层多项基础安全能力,及阿里云数据中台丰富的应用场景实践,能够在保障数据安全的前提下完成多方数据联合分析、联合训练、联合预测,实现数据价值的流通,为企业提供立足数据业务原生的数据安全流通解决方案。
可用不可见 保障数据多方计算安全
营销投放是零售企业最常面对的商业场景之一。
零售企业选择一个媒介渠道进行营销投放时,为了保证相对最优投放效果,往往需要提供自身已覆盖市场数据与渠道数据交叉计算分析,并进行模型训练和预测,以确保此次营销投放的确能够触达目标市场。
但在这个过程中,企业往往又不希望自身市场数据被媒介渠道获悉,因此在数据处理过程中,需要有个“安全环境”,做到在数据不流通的前提下实现数据价值的流通,达到包括数据分析、匹配、分层等动作都局限在“安全环境”范围内产生,待数据处理完成后,直接产生数据结果,以方便后续基于业务场景的直接使用。
“安全环境”的作用就在于,能够让企业和平台都在无法获悉对方基础数据的前提下,完成数据业务分析及数据应用,做到数据的可用不可见。
而Datatrust就充当了“安全环境”角色,基于业内领先的隐私增强技术,它能够为数据参与多方构建一个统一的数据安全融通环境,实现ID去标识化、特征标签保护、商业数据保护等多方面目的——此外,DataTrust通过一体化的使用交互和体验,大大降低了企业使用门槛,同时数据处理动作和流程能够被清晰表达。
目前,DataTrust产品能力已通过阿里云数据中台在多个行业获得实践,尤其是在“智能营销”“智能广告推荐”等场景,获得企业极大认可。
多维核心技术 数据安全背后的多重把关
为什么DataTrust一经推出就能经受多行业不同数据安全场景挑战?除了依靠阿里云数据中台在零售、金融、互联网等多个细分行业解决方案的切入外,更重要的一点还在于,其内嵌的四大核心技术,可针对不同行业数据安全标准及企业个性化数据隐私需求,给予特定匹配。
比如,零售企业在数据安全层面核心保障数据合规使用及防泄漏(隐私保护),需要充分遵守包括《网络安全法》《电商法》《消费者保护法》等法律法规的要求;但在金融或者医疗行业,有更高的基于行业的数据安全保障标准,因此在这些行业,在数据安全技术上也必须提出更高要求。
据介绍,DataTrust现阶段已拥有四大隐私增强计算核心技术。

一、可信执行环境(Trusted Execution Environment,TEE)
TEE是硬件中的一个独立的安全环境,与操作系统并行运行。硬件本身保证TEE中代码和数据的机密性和完整性,也就是说,TEE是硬件服务提供商应用硬件在现实世界中构造的安全计算环境。
应用TEE实现隐私增强计算的过程可以通过下图描述。

· 步骤1:各个参与方将自己的数据x通过安全链路传输给TEE;
· 步骤2:TEE在保证机密性和完整性的条件下完成计算任务;
· 步骤3:TEE通过安全链路将计算结果发送给各个参与方。
目前,DataTrust应用英特尔的软件防护扩展(Software Guard Extensions,SGX)作为TEE。
SGX是Intel CPU提供的一组指令集和内存访问机制,应用程序可以通过这组指令集和内存访问机制实现一个被称为安全区(Enclave)的容器,在应用程序的地址空间中划分出一个被保护的区域,为容器内的代码和数据提供机密性和完整性保护,免受拥有特殊权限的恶意软件的破坏。
二、安全多方计算(Secure Multi-Party Computation,MPC)
MPC是密码学中的定义,意为在无可信计算方的情况下,多个参与方各自持有秘密输入完成对某个函数的计算,但每个参与方最终只能得到计算结果和能从自己输入和计算结果中推出的信息,其他信息均可得到保护。
安全多方计算的定义可以通过下图描述。

DataTrust目前支持专用MPC协议隐私集合求交(Private Set Intersection,PSI)实现两方数据的安全匹配;同时,支持上亿级别输入的PSI协议,并根据单次匹配、周期性匹配、增量匹配等实际业务场景提供不同类型PSI协议的支持。
三、联邦学习(Federated Learning,FL)
联邦学习是一种多个参与方在保证各自原始私有数据不出数据方定义的私有边界的前提下,协作完成某项机器学习任务的机器学习模式。
根据隐私安全诉求与训练效率的不同,可以通过MPC、同态加密(Homomorphic Encryption,HE)、差分隐私(定义见下)等多种方式实现联邦学习。

DataTrust支持基于差分隐私的联邦学习,相应技术方案在保证效果和性能的前提下,拥有安全上的理论支撑。值得注意的是,DataTrust支持的联邦学习算法已覆盖神经网络和决策树等常用算法。
四、差分隐私(Differential Privacy,DP)
DP是一种基于对数据引入随机扰动,并从理论层面度量随机扰动所带来的隐私保护程度的隐私保护方法。根据随机扰动方式的不同,DP分为在原始数据层面进行随机扰动的本地差分隐私(Local Differential Privacy,LDP)和在计算结果层面进行随机扰动的中心差分隐私(Central Differential Privacy,CDP)。

DataTrust在FL层面应用DP实现训练/预测过程中的个人隐私保护,并综合使用CDP/LDP技术,以支持不同的学习/预测任务。
需要注意的是,DataTrust的多套核心技术并非一成不变,而是能够依据企业日益丰富的数据安全场景,进行升级更迭,同时还将继续引入更多行业领先的隐私增强计算技术,充盈产品底层能力,“持续响应政策数据监管要求,顺应市场数据安全诉求,将保障数据安全的能力全量开放给有需要的企业,将会是DataTrust未来相当长时间内的战略目标。”DataTrust产品负责人如是说。
数据中台是企业数智化的必经之路,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。
目前正通过阿里云对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案、政务数据中台解决方案等细分场景。
其中阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入,包括:
- - Dataphin,一站式、智能化的数据构建及管理平台;
- - Quick BI,随时随地 智能决策;
- - Quick Audience,全方位洞察、全域营销、智能增长;
- - Quick A+, 跨多端全域应用体验分析及洞察的一站式数据化运营平台;
- - Quick Stock, 智能货品运营平台;
- - Quick Decision,智能决策平台。
本文为阿里云原创内容,未经允许不得转载。
重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障的更多相关文章
- 重磅发布: 阿里云WAF日志实时分析上线 (含视频)
摘要: 阿里云WAF与日志服务打通,对外开发Web访问与攻击日志.提供近实时的网站具体的日志自动采集存储.并提供基于日志服务的查询分析.报表报警.下游计算对接与投递的能力. 背景 Web攻击形势 互联 ...
- 阿里云弹性容器实例产品 ECI ——云原生时代的基础设施
阿里云弹性容器实例产品 ECI ——云原生时代的基础设施 1. 什么是 ECI 弹性容器实例 ECI (Elastic Container Instance) 是阿里云在云原生时代为用户提供的基础计算 ...
- 浅析阿里云API网关的产品架构和常见应用场景
自上世纪60年代计算机网络发展开始,API(Application Programming Interface )随之诞生,API即应用程序接口,是实现系统间衔接的桥梁.时至今日,API市场已经形成了 ...
- 阿里云HBase推出全新X-Pack服务 定义HBase云服务新标准
2018年12月13日,第八届中国云计算标准和应用大会在京召开,会上阿里云HBase宣布推出全新X-Pack服务,支持SQL.时序.时空.图.全文检索能力.复杂分析,从处理到分析全栈式数据库,客户开箱 ...
- 阿里云HBase Ganos全新升级,推空间、时空、遥感一体化基础云服务
1.HBase Ganos是什么 Ganos是阿里云时空PaaS服务的自研核心引擎.Ganos已作为云数据库时空引擎与数据库平台融合,建立了以自研云原生数据库POALRDB为基础,联合NoSQL大数据 ...
- 边缘节点服务ENS重磅升级 阿里云首次定义“边缘云计算”概念层层深入
随着5G.物联网时代的到来以及云计算应用的逐渐增加,传统集中式的云计算技术已经无法满足终端侧“大连接,低时延,大带宽”的需求.结合边缘计算的概念,云计算将必然发展到下一个技术阶段,也就是将云计算的能力 ...
- 重磅!阿里云Promtheus 正式免费公测
每日头条 重磅!容器集群监控利器 阿里云Promtheus 正式免费公测 Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架.2019 年7月3日,阿里云Promth ...
- 阿里云数据库自研产品亮相国际顶级会议ICDE 推动云原生数据库成为行业标准
4月9日,澳门当地时间下午4:00-5:30,阿里云在ICDE 2019举办了主题为“云时代的数据库”的专场分享研讨会. 本次专场研讨会由阿里巴巴集团副总裁.高级研究员,阿里云智能数据库产品事业部负责 ...
- 奇点云数据中台技术汇(三)| DataSimba系列之计算引擎篇
随着移动互联网.云计算.物联网和大数据技术的广泛应用,现代社会已经迈入全新的大数据时代.数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产.如何处理大数据,挖 ...
- 奇点云数据中台技术汇(一) | DataSimba——企业级一站式大数据智能服务平台
在这个“数据即资产”的时代,大数据技术和体量都有了前所未有的进步,若企业能有效使用数据,让数据赚钱,这必将成为企业数字化转型升级的有力武器. 奇点云自研的一站式大数据智能服务平台——DataSimba ...
随机推荐
- gcc生成静态链接库与动态链接库步骤,并链接生成可执行文件的简单示例
编写 mylib.h void test(); 编写 mylib.c #include<stdio.h> void test(){ printf("hello world&quo ...
- TypeScript必知三部曲(二)JSX的编译与类型检查
在本三部曲系列的第一部中,我们介绍了TypeScript编译的两种方案(tsc编译.babel编译)以及二者的重要差异,同时分析了IDE是如何对TypeScript代码进行类型检查的.该部分基本涵盖了 ...
- 用phpStudy配置apache服务器
一:下载phpStudy 1进入官网https://www.xp.cn/download.html 选择稳定的2018版本 2执行下载好的文件,选择下载地址 注意!这里的安装路径不能有中文 3亮两个绿 ...
- JQ实现音乐插件并自动播放
这里分享我最近写出来的一个小东西,基于jq的音乐播放器,可以嵌套到网站 效果截图: 具体首页代码如下: <!DOCTYPE html> <html> <head> ...
- 大模型时代的PDF解析工具
去年(2023年)是大模型爆发元年.但是大模型具有两个缺点:缺失私有领域知识和幻觉.缺失私有领域知识是指大模型训练时并没有企业私有数据/知识,所以无法正确回答相关问题.并且在这种情况下,大模型会一本正 ...
- hdfs开启回收站(废纸篓)
1.背景 我们知道,在mac系统上删除文件,一般情况下是可以进入 废纸篓里的,如果此时我们误删除了,还可以从 废纸篓中恢复过来.那么在hdfs中是否存在类似mac上的废纸篓这个功能呢?答案是存在的. ...
- C# PaddleOCR 车牌识别
效果 车牌识别测试地址 http://47.108.88.211/manual/VehPlateTest.html 通用OCR识别测试地址 http://47.108.88.211/manual/OC ...
- JAVA去掉字符串前面的0、去掉字符串后面的0
//去掉字符串前面的0 String str1 = "00123400"; String newStr1 = str1.replaceAll("^0+", &q ...
- 运行xxl-job,整合xxl-job至jeecg-boot项目
1.前言:xxl-job是一个分布式任务调度平台,其核心设计目标是开发迅速.学习简单.轻量级.易扩展.现已开放源代码并接入多家公司线上产品线,开箱即用. 源码仓库地址:https://gitee.co ...
- .NET开源免费、功能强大的 Windows 截图录屏神器
前言 今天大姚给大家分享一款.NET开源免费(基于GPL3.0开源协议).功能强大.简洁灵活的 Windows 截图.录屏.Gif动图制作神器:ShareX. 功能特性 ShareX 是一个开源的屏幕 ...