简介: 在企业的发展过程中,如果不重视敏感数据的保护,和数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。本文将以一个最常见的场景:消费者隐私数据保护,展示如何利用Dataphin的安全能力,保障企业的数据安全。

作者:龙裔

《基于数据分类分级和敏感数据保护,保障企业数据安全》一文中,我们讲解了Dataphin中资产安全的主要应用场景和基本概念,那么如何利用Dataphin的安全能力,来保障企业的数据安全呢?

我们来看一个最常见的案例:消费者隐私数据保护。

场景介绍

近几年,随着消费者个人意识的崛起和对隐私的重视,数据安全成为了一个越来越热门的话题,国家也陆续发布了一些相关规定,来规范数据的采集和使用。在企业的发展过程中,如果不重视敏感数据的保护,不重视数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。

而在企业领域的敏感信息中,个人敏感信息是绝对的大头,包括个人的身份信息(姓名、身份证号码)、联系方式(手机、邮箱、地址)、个人财产信息、生物识别信息等等,都属于个人敏感数据。这些数据一旦泄漏,对用户的个人生活以及对企业的业务运行,都会产生非常大的损害,所以在企业的业务运转中,要对消费者的个人隐私数据进行脱敏保护。

图片:支付宝中,对用户姓名与用户账号的脱敏保护

主要流程

首先,我们回顾一下在Dataphin上,实现敏感数据保护的主要流程:

在Dataphin中,实现敏感数据保护,主要可以分为以下三个步骤:

1、识别敏感数据:即设定数据分类、数据分级、识别规则等内容

2、设置敏感数据保护方式:为识别的敏感数据选择合适的脱敏算法、设定脱敏规则

3、数据消费:在即席查询、开发数据写生产等场景进行数据消费时脱敏

详细步骤

接下来,我们以用户敏感信息中,最常见的用户姓名为例,展示如何一步步的首先用户姓名的识别和脱敏保护。

1、识别敏感数据

假设我们已经建立好了数据分类和数据分级(Dataphin会内置通用的分类和分级标准,支持开箱即用),我们直接进入新建识别规则的模拟步骤:

新建一个【用户姓名】的识别规则;

扫描范围选择【全部】;

扫描方式选择【内置识别】-【名字】(如果用户姓名的字段都叫【name】,也可以配置正则规则【^name$】);

数据分类选择【个人数据(C)】;

数据分级选择【机密数据(L3)】(根据自己企业的情况灵活调衡);

优先级选择【3】(中间优先级,根据自己企业的情况灵活调整);

配置完成识别规则后,我们可以触发一次【手动规则扫描】,或者等到第二天,系统会自动执行一次全局扫描。最终敏感数据识别的结果,都可以在【识别记录】页面看到:

2、设置敏感数据保护方式

识别到敏感数据之后,下一步就是给敏感数据设置合适的保护方式,从而保证数据不泄漏。

Dataphin当前内置了多种遮盖脱敏规则(如【张三】,显示成【*三】)、哈希脱敏规则(如【张三】,显示为【615DB57AA314529AAA0FBE95B3E95BD3】),可以满足大部分业务场景下的数据保护需求,并在未来支持加解密算法和用户自定义脱敏算法。

这里建议大家根据业务需求,选择合适的算法。比如对于用户姓名,在大部分的业务场景中(如支付宝转账),都是不能显示完整的名称,但是可以显示一部分,用于身份确认,这样就可以选择内置的【中文姓名】的脱敏算法

选择好合适的脱敏算法之后,我们就可以配置动态脱敏规则了,还是以用户姓名为例:

新建一个【用户姓名脱敏】的脱敏规则;

绑定已经建好的敏感数据识别规则【用户姓名】;

应用场景选择【写开发表】、【即席查询】;

脱敏方式选择【遮盖掩码-中文姓名】;

生效范围选择【全部】

至此,我们的敏感数据识别和保护就已经完全配置完成了,接下来在数据消费的过程中,就可以对数据进行保护了。

3、数据消费

下面已即席查询为例,展示敏感数据识别和脱敏的效果:

可以看到,我们开始往表格里写入的数据是【张三】,因为写入了敏感数据【name】字段,也就是【用户姓名】,所以在数据读取的时候,系统自动的进行了脱敏,操作的同学只能够看到【*三】,从而防止敏感数据泄漏,保护了数据安全。

结语

上面通过用户姓名这样一个非常很简单的案例,串讲了整个敏感数据识别和脱敏的主流程,相信能帮助您理解整个数据安全保护的机制;而在主流程之外,还有数据分类分级的制定、审核识别记录并手动修改、脱敏白名单等流程。同时,在企业实际的数据安全保护中,还有更多的系统工作要做,比如制定符合企业的数据分类分级体系、建立完整的数据识别体系等等。

原文链接

本文为阿里云原创内容,未经允许不得转载。

如何基于Dataphin实现敏感数据保护的更多相关文章

  1. 阿里云发布敏感数据保护产品SDDP,数据贴身防护实现“外防内控”

    数据安全问题,尤其是个人信息保护问题,一直是所有企业和个人关注的重点问题,7月10日,阿里云针对云上企业正式发布一款敏感数据保护产品SDDP(Sensitive Data Detection and ...

  2. Dataphin的代码自动化能力如何助力商业决策

    前言 随着大数据趋势的迅速增长,数据的重要性与日俱增,企业内看数据.用数据的诉求越来越强烈,其中最常见的就是各种经营报表数据:老板每日早晨9点准时需要看到企业核心的经营数据,以便进行企业战略及方向决策 ...

  3. 阿里大数据产品Dataphin上线公共云,将助力更多企业构建数据中台

    日前,由阿里数据打造的智能数据构建与管理Dataphin,重磅上线阿里云-公共云,开启智能研发版本的公共云公测!在此之前,Dataphin以独立部署方式输出并服务线下客户,已助力多家大型客户高效自动化 ...

  4. 阿里云智能数据构建与管理 Dataphin公测,助力企业数据中台建设

    阿里云智能数据构建与管理 Dataphin (下简称“Dataphin”)近日重磅上线公共云,开启智能研发版本的公共云公测!在此之前,Dataphin以独立部署方式输出并服务线下客户,已助力多家大型客 ...

  5. 结合docker发布后端项目(基于gradle包管理)的shell脚本

    结合docker发布后端项目(基于gradle包管理)的shell脚本 本教程依据个人理解并经过实际验证为正确,特此记录下来,权当笔记. 注:基于linux操作系统(敏感信息都进行了处理) 目前主流的 ...

  6. Gartner:用自适应安全架构来应对高级定向攻击

    发表于2015-06-24   摘要:当前的防护功能难以应对高级的定向攻击,由于企业系统所受到的是持续攻击,并持续缺乏防御力,面向“应急响应”的特别方式已不再是正确的思维模式,Garnter提出了用自 ...

  7. web安全/渗透测试--1--web安全原则

    web 安全:  https://blog.csdn.net/wutianxu123/article/category/8037453/2 web安全原则 安全应该是系统开发之初就考虑的问题.换句话说 ...

  8. 转载: 华为内部Web安全测试原则

    原链接:http://www.ha97.com/5520.html Web安全原则 1.认证模块必须采用防暴力破解机制,例如:验证码或者多次连续尝试登录失败后锁定帐号或IP. 说明:如采用多次连续尝试 ...

  9. Windows的加密能力

    尽管Windows不再具备往日那样的统治地位,在智能手机领域,甚至已经沦落为一种小众平台,Windows仍然是主要的商业应用运行平台.软件开发平台.硬件及结构等设计软件运行平台.大多数人在学习计算机时 ...

  10. WebApp 安全风险与防护课堂(第二讲)开课了!

    本文由葡萄城技术团队于原创并首发 转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 在昨天的公开课中,由于参与的小伙伴们积极性和热情非常高,我们的讲师Carl ...

随机推荐

  1. pycharm 常见易错的PEP8规范

    PEP8规范 ( Python Enhancement Proposal ) PEP 8: E231 missing whitespace after ','这个意思是逗号后面要有一个空格 PEP 8 ...

  2. 使用Go语言开发一个短链接服务:三、项目目录结构设计

    章节  使用Go语言开发一个短链接服务:一.基本原理  使用Go语言开发一个短链接服务:二.架构设计  使用Go语言开发一个短链接服务:三.项目目录结构设计  使用Go语言开发一个短链接服务:四.生成 ...

  3. Redis高可用之战:主从架构

    ★ Redis24篇集合 1 主从模式介绍 在笔者的另外两篇文章 <Redis系列:RDB内存快照提供持久化能力>.<Redis稳定性之战:AOF日志支撑数据持久化>中,我们介 ...

  4. KingbaseES 与 Oracle XML 语法比较

    KingbaseES 内置支持 XML 相关操作,也可以通过xml2 插件进行扩展支持.以下通过例子介绍 KingbaseES XML 与Oracle 在用法上存在的一些差异. 一.数据准备 crea ...

  5. C++ 中的 volatile 和 atomic

    C++ 中的 volatile 和 atomic 0. TL;DR std::atomic 用于多线程并发场景,有两个典型使用场景: 原子操作:对 atomic 变量的操作(读/写/自增/自减)仿佛受 ...

  6. SQL Server表分区-水平分区3

    目录 一.常用分区步骤 1.创建文件组 2.创建数据文件到文件组里面 3.使用图形界面向导创建分区表(不推荐) 3.使用T-SQL构建分区函数与分区方案(推荐) [3.1]建表时构造 [3.2]已有表 ...

  7. 4 JavaScript数组和对象

    4 数组和对象 在JS中创建数组非常简单. 直接[ ]即可. 也可以用正规军的new Array(). 不过效果都是一样的. var as = [11,22,33,44,55]; var bs = n ...

  8. #单调栈,树状数组#CF1635F Closest Pair

    题目 设 \(f(x,y)=|a_x-a_y|*(w_x+w_y)\),其中 \(a\) 单调递增 多组询问求 \(\min_{l\leq l'<r'\leq r}\{f(l',r')\}\) ...

  9. #双指针#洛谷 7405 [JOI 2021 Final] 雪玉

    题目传送门 分析 无论怎样刮风,雪球的相对位置不会改变, 实际上每一个空段都由左右两个雪球瓜分(边界空段除外), 那么按照空段长度从小到大排序,用双指针找到恰好第一个未瓜分的位置 代码 #includ ...

  10. #dp#洛谷 4158 [SCOI2009]粉刷匠

    题目 分析 首先每条木板可以分开处理,再合并起来求最大值 下面讲一下单独处理每条木板的情况 设\(dp[k][m]\)表示前\(m\)个格子粉刷了\(k\)次最多正确粉刷的格子数 那么 \[dp[k] ...