CHDFS 安全便捷的大数据访问体验
一、背景
云 HDFS(Cloud HDFS,CHDFS)是腾讯云提供的支持标准 HDFS 访问协议、卓越性能、分层命名空间的分布式文件系统。
CHDFS 主要解决大数据场景下海量数据存储和数据分析,能够为大数据用户在无需更改现有代码的基础上,将本地自建的 HDFS 文件系统无缝迁移至具备高可用性、高扩展性、低成本、可靠和安全的 CHDFS 上。以此实现存算分离,实现计算节点可动态的扩缩容。
因此 CHDFS 主要的用户群体是大数据体系的研发人员,为了满足用户在传统的 Hadoop 环境下的使用习惯,同时满足用户的权限需求,CHDFS 通过以下措施,提供了安全便捷的大数据访问体验。
二、来源管控
存算分离带来了存储的云端托管,使计算节点不再依赖本地的存储,但同时也带来了存储时延的增加,因此存算分离更适合于同地域同机房的访问。CHDFS 在设计之初,就假定用户的大数据集群运行在腾讯云的 VPC 网络(包括 CVM 和黑石)。
因此用户只用通过以下三步,即可限制来源:
1、新建权限组,并在权限组中指定 VPC(必须本账户下的 VPC)。

2、在权限组里面添加规则,授予 VPC 网段里的某一个子网段的只读或者读写权限。同一个权限组中的多条规则,根据优先级来确定权限。

3、在文件系统的挂载点中绑定权限组,一个文件系统可以绑定多个权限组,请求满足任何一个权限组的规则,即获得相应的访问权限。

三、POSIX 权限与超级用户
CHDFS 兼容 HDFS 的 POSIX 的权限规则,该权限规则和 Linux 文件系统的的规则类似。即每一层的目录和文件都有 User,Group 与 Other 权限(rwx)。整个权限规则可简述如下:
1、用户执行 Hadoop 命令行或者运行某个大数据 JOB
2、Job 运行中需要访问 CHDFS 的某个路径, 即以执行进程的用户身份与组身份访问 CHDFS 的某个路径。
3、CHDFS 从根据访问的路径,从根目录开始,层层检查。如果用户名匹配文件或者目录的用户名,则拥有文件和目录的 User 权限,如果用户组名匹配,则拥有 Group 权限,否则只拥有 Other 权限。
4、对于目录要进入下一层,必须拥有 X 权限,对于目录下创建删除文件必须拥有 W 权限,对于列出目录下的文件,必须有 R 权限。
5、对于读取文件,必须要有 R 权限,对于修改文件必须有 W 权限。
对于普通用户,使用以上的权限规则进行校验,但同时 CHDFS 也支持了超级用户, 超级用户拥有对文件目录的一切操作权限,适用于配置管理员。
POSIX 的权限开关与超级用户的设置,可以在新建文件系统时,或者在后续在文件系统属性下编辑。


四、接入 Hadoop Ranger 权限体系
Hadoop Ranger 作为一站式的权限体系解决方案, 不仅支持存储端权限管控,还支持 YARN,Hive 等组件权限管控。因此,为了维持客户的使用习惯,我们提供了 CHDFS 的 Ranger 接入解决方案,方便客户使用 Ranger 来进行 CHDFS 的权限管控。CHDFS 接入 Ranger 权限体系的架构如下所示

我们在 Ranger Admin 控制中心,注册 CHDFS 服务的相关信息,并配置 CHDFS 的服务后,即可配置 CHDFS 的相关权限 policy,如下所示。

CHDFS 插件端开启进行 ranger 鉴权后,即会把所有访问 CHDFS 的请求转发给 COS Ranger Service 进行鉴权, COS Ranger Service 根据从 Ranger Admin 拉取 policy,进行权限检查。有关 CHDFS 接入 Ranger 权限的配置说明,请参考 CHDFS 控制台文档。
五、总结
CHDFS 作为云端托管的大数据存储,从设计之初,就充分考虑了 HDFS 用户的使用习惯。通过提供限制来源 VPC、IP 网段、POSIX 鉴权、超级用户等特性,并支持接入 Hadoop Ranger 权限体系。方便客户的同时,也充分的保证了安全性与灵活性。
关于我们
云+社区「腾讯云存储团队」主页,涵盖了腾讯云存储团队最新动态、团队信息、产品矩阵、技术文档、视频教程等,欢迎关注或留言,给出您的宝贵建议。
CHDFS 安全便捷的大数据访问体验的更多相关文章
- 腾讯混合云存储 TStor 系列再添新成员,并行存储一体机正式发布
最近国内某大型互联网公司依靠其数据优势成功上市,可见数据的重要性,而数据和存储密不可分,您真的知道自己需要更高性能存储吗? 在当今数据爆发式增长的时代,数据已经成为很多行业最重要的资源,没有之一. 数 ...
- 使用 HDFS 协议访问对象存储服务
背景介绍 原生对象存储服务的索引是扁平化的组织形式,在传统文件语义下的 List 和 Rename 操作性能表现上存在短板.腾讯云对象存储服务 COS 通过元数据加速功能,为上层计算业务提供了等效于 ...
- Dapper.NET——轻量ORM
Dapper.NET使用 http://www.cnblogs.com/yankliu-vip/p/4182892.html 本文目录 Dapper.NET使用 1.为什么选择Dapper 2.以Da ...
- PostgreSQL 与 MySQL 相比,优势何在?
一. PostgreSQL 的稳定性极强, Innodb 等引擎在崩溃.断电之类的灾难场景下抗打击能力有了长足进步,然而很多 MySQL 用户都遇到过Server级的数据库丢失的场景——mysql系统 ...
- Apworks框架实战(一):Apworks到底是什么?
简介 Apworks是一款基于Microsoft .NET的面向领域驱动的企业级应用程序开发框架,它适用于以领域模型为核心的企业级系统的开发和集成.Apworks不仅能够很好地支持经典的分层架构,而且 ...
- Dapper.Net 应用
Dapper应用 1.Dapper是什么 Dapper是一款轻量级ORM工具.如果你在小的项目中,使用Entity Framework.NHibernate 来处理大数据访问及关系映射,未免有点杀鸡用 ...
- 可扩展Web架构与分布式系统(转)
1.1. web分布式系统的设计原则 搭建和运营一个可伸缩的web站点或者应用程序意味着什么?在原始层面上这仅仅是用户通过互联网连接到远程资源-使系统变得可伸缩的部分是将资源.或者访问的资源,分布于多 ...
- IMAP和POP3有什么区别
http://help.163.com/10/0203/13/5UJONJ4I00753VB8.html?servCode=6010237 IMAP和POP3有什么区别? POP3协议允许电子邮件 ...
- 【转】POP3、SMTP和IMAP之间的区别和联系
POP3 POP3是Post Office Protocol 3的简称,即邮局协议的第3个版本,它规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议.它是因特网电子邮件的第 ...
- Dapper.NET使用(转)
Dapper.NET使用 本文目录 Dapper.NET使用 1.为什么选择Dapper 2.以Dapper(4.0)为例. 2.1 在数据库中建立几张表. 2.2实体类. 3.使用方法 3.1 一 ...
随机推荐
- .NET 开源高性能 MQTT 类库
前言 随着物联网(IoT)技术的迅猛发展,MQTT(消息队列遥测传输)协议凭借其轻量级和高效性,已成为众多物联网应用的首选通信标准. MQTTnet 作为一个高性能的 .NET 开源库,为 .NET ...
- Python 潮流周刊#71:PyPI 应该摆脱掉它的赞助依赖(摘要)
本周刊由 Python猫 出品,精心筛选国内外的 250+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...
- ARM SMMU原理与IOMMU技术(“VT-d” DMA、I/O虚拟化、内存虚拟化)
名词缩写 ASID:Address Space ID 地址空间标识符 CD:Context Descriptor: 上下文描述符: CTP:Context-table pointer 上下文表指针 E ...
- MySQL精品学习资源合集 | 含学习教程笔记、运维技巧、图书推荐
MySQL凭借开源.免费.低门槛.稳定等优势,成为了当前最流行的关系型数据库之一.从1998年发行第一版以来,通过不断地更新迭代,MySQL被越来越多的公司使用,已然成为当下潮流. 为了帮助大家更好地 ...
- ssh建立github连接 基于ssh密钥
1. 建立公钥和私钥 ps:公钥放在github上面的,私钥放在自己本地电脑 : 先生成密钥:打开 gitbash 输入命令: ssh-keygen -t rsa -b 4096 -C "z ...
- ARM 版 Kylin V10 部署 KubeSphere 3.4.0 不完全指南
前言 知识点 定级:入门级 KubeKey 安装部署 ARM 版 KubeSphere 和 Kubernetes ARM 版麒麟 V10 安装部署 KubeSphere 和 Kubernetes 常见 ...
- Fluent Operator 2.5.0 发布:新增多个插件
日前,Fluent Operator 发布了 v2.5.0. Fluent Operator v2.5.0 新增 11 个 features, 其中 Fluent Bit 新增支持 7 个插件, Fl ...
- Effective C++:把C++看作一个语言联邦
C++曾经是从C with class发展而来的,但是现在随着异常.模板.STL等等的发展,C++已变得相当的多样与庞大,这一方面让C++功能强大无比的多重范式语言,上天入地无所不能:另一方面,也给学 ...
- 手把手教会你使用Markdown【从入门到精通一篇就够了】
目录 一.Markdown是什么 二.Markdown优点 三.Markdown的基本语法 3.1 标题 3.2 字体 3.3 换行 3.4 引用 3.5 链接 3.6 图片 3.7 列表 3.8 分 ...
- 轻量级网络-ShuffleNetv2 论文解读
摘要 1.介绍 2.高效网络设计的实用指导思想 G1-同样大小的通道数可以最小化 MAC G2-分组数太多的卷积会增加 MAC G3-网络碎片化会降低并行度 G4-逐元素的操作不可忽视 3.Shuff ...