一、背景

云 HDFS(Cloud HDFS,CHDFS)是腾讯云提供的支持标准 HDFS 访问协议、卓越性能、分层命名空间的分布式文件系统。

CHDFS 主要解决大数据场景下海量数据存储和数据分析,能够为大数据用户在无需更改现有代码的基础上,将本地自建的 HDFS 文件系统无缝迁移至具备高可用性、高扩展性、低成本、可靠和安全的 CHDFS 上。以此实现存算分离,实现计算节点可动态的扩缩容。

因此 CHDFS 主要的用户群体是大数据体系的研发人员,为了满足用户在传统的 Hadoop 环境下的使用习惯,同时满足用户的权限需求,CHDFS 通过以下措施,提供了安全便捷的大数据访问体验。

二、来源管控

存算分离带来了存储的云端托管,使计算节点不再依赖本地的存储,但同时也带来了存储时延的增加,因此存算分离更适合于同地域同机房的访问。CHDFS 在设计之初,就假定用户的大数据集群运行在腾讯云的 VPC 网络(包括 CVM 和黑石)。

因此用户只用通过以下三步,即可限制来源:

1、新建权限组,并在权限组中指定 VPC(必须本账户下的 VPC)。

2、在权限组里面添加规则,授予 VPC 网段里的某一个子网段的只读或者读写权限。同一个权限组中的多条规则,根据优先级来确定权限。

3、在文件系统的挂载点中绑定权限组,一个文件系统可以绑定多个权限组,请求满足任何一个权限组的规则,即获得相应的访问权限。

三、POSIX 权限与超级用户

CHDFS 兼容 HDFS 的 POSIX 的权限规则,该权限规则和 Linux 文件系统的的规则类似。即每一层的目录和文件都有 User,Group 与 Other 权限(rwx)。整个权限规则可简述如下:

1、用户执行 Hadoop 命令行或者运行某个大数据 JOB

2、Job 运行中需要访问 CHDFS 的某个路径, 即以执行进程的用户身份与组身份访问 CHDFS 的某个路径。

3、CHDFS 从根据访问的路径,从根目录开始,层层检查。如果用户名匹配文件或者目录的用户名,则拥有文件和目录的 User 权限,如果用户组名匹配,则拥有 Group 权限,否则只拥有 Other 权限。

4、对于目录要进入下一层,必须拥有 X 权限,对于目录下创建删除文件必须拥有 W 权限,对于列出目录下的文件,必须有 R 权限。

5、对于读取文件,必须要有 R 权限,对于修改文件必须有 W 权限。

对于普通用户,使用以上的权限规则进行校验,但同时 CHDFS 也支持了超级用户, 超级用户拥有对文件目录的一切操作权限,适用于配置管理员。

POSIX 的权限开关与超级用户的设置,可以在新建文件系统时,或者在后续在文件系统属性下编辑。



四、接入 Hadoop Ranger 权限体系

Hadoop Ranger 作为一站式的权限体系解决方案, 不仅支持存储端权限管控,还支持 YARN,Hive 等组件权限管控。因此,为了维持客户的使用习惯,我们提供了 CHDFS 的 Ranger 接入解决方案,方便客户使用 Ranger 来进行 CHDFS 的权限管控。CHDFS 接入 Ranger 权限体系的架构如下所示

我们在 Ranger Admin 控制中心,注册 CHDFS 服务的相关信息,并配置 CHDFS 的服务后,即可配置 CHDFS 的相关权限 policy,如下所示。

CHDFS 插件端开启进行 ranger 鉴权后,即会把所有访问 CHDFS 的请求转发给 COS Ranger Service 进行鉴权, COS Ranger Service 根据从 Ranger Admin 拉取 policy,进行权限检查。有关 CHDFS 接入 Ranger 权限的配置说明,请参考 CHDFS 控制台文档

五、总结

CHDFS 作为云端托管的大数据存储,从设计之初,就充分考虑了 HDFS 用户的使用习惯。通过提供限制来源 VPC、IP 网段、POSIX 鉴权、超级用户等特性,并支持接入 Hadoop Ranger 权限体系。方便客户的同时,也充分的保证了安全性与灵活性。

关于我们

云+社区「腾讯云存储团队」主页,涵盖了腾讯云存储团队最新动态、团队信息、产品矩阵、技术文档、视频教程等,欢迎关注或留言,给出您的宝贵建议。

CHDFS 安全便捷的大数据访问体验的更多相关文章

  1. 腾讯混合云存储 TStor 系列再添新成员,并行存储一体机正式发布

    最近国内某大型互联网公司依靠其数据优势成功上市,可见数据的重要性,而数据和存储密不可分,您真的知道自己需要更高性能存储吗? 在当今数据爆发式增长的时代,数据已经成为很多行业最重要的资源,没有之一. 数 ...

  2. 使用 HDFS 协议访问对象存储服务

    背景介绍 原生对象存储服务的索引是扁平化的组织形式,在传统文件语义下的 List 和 Rename 操作性能表现上存在短板.腾讯云对象存储服务 COS 通过元数据加速功能,为上层计算业务提供了等效于 ...

  3. Dapper.NET——轻量ORM

    Dapper.NET使用 http://www.cnblogs.com/yankliu-vip/p/4182892.html 本文目录 Dapper.NET使用 1.为什么选择Dapper 2.以Da ...

  4. PostgreSQL 与 MySQL 相比,优势何在?

    一. PostgreSQL 的稳定性极强, Innodb 等引擎在崩溃.断电之类的灾难场景下抗打击能力有了长足进步,然而很多 MySQL 用户都遇到过Server级的数据库丢失的场景——mysql系统 ...

  5. Apworks框架实战(一):Apworks到底是什么?

    简介 Apworks是一款基于Microsoft .NET的面向领域驱动的企业级应用程序开发框架,它适用于以领域模型为核心的企业级系统的开发和集成.Apworks不仅能够很好地支持经典的分层架构,而且 ...

  6. Dapper.Net 应用

    Dapper应用 1.Dapper是什么 Dapper是一款轻量级ORM工具.如果你在小的项目中,使用Entity Framework.NHibernate 来处理大数据访问及关系映射,未免有点杀鸡用 ...

  7. 可扩展Web架构与分布式系统(转)

    1.1. web分布式系统的设计原则 搭建和运营一个可伸缩的web站点或者应用程序意味着什么?在原始层面上这仅仅是用户通过互联网连接到远程资源-使系统变得可伸缩的部分是将资源.或者访问的资源,分布于多 ...

  8. IMAP和POP3有什么区别

    http://help.163.com/10/0203/13/5UJONJ4I00753VB8.html?servCode=6010237 IMAP和POP3有什么区别?   POP3协议允许电子邮件 ...

  9. 【转】POP3、SMTP和IMAP之间的区别和联系

    POP3 POP3是Post Office Protocol 3的简称,即邮局协议的第3个版本,它规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议.它是因特网电子邮件的第 ...

  10. Dapper.NET使用(转)

    Dapper.NET使用 本文目录 Dapper.NET使用 1.为什么选择Dapper 2.以Dapper(4.0)为例. 2.1 在数据库中建立几张表. 2.2实体类. 3.使用方法 3.1  一 ...

随机推荐

  1. [OI] 整体二分

    整体二分可以理解成普通二分改版,其实并没有改多少,并且一般对 check() 函数的复杂度要求更宽松 先来看一道经典题目:求区间排名 给一个数列,若干组询问 \((l,r,k)\),求 \([l,r] ...

  2. k8s的容器的webssh实现

    Vite2.x + Vue3.x + Xtermjs4 相关信息 编程语言:TypeScript 4.x + JavaScript 构建工具:Vite 2.x 前端框架:Vue 3.x 路由工具:Vu ...

  3. initrd&init进程

    initrd的全名是 init ramdisk,是一个启动时存在于内存的文件系统. kernal 到 initrd的流程 在GRUB加载kernel时,kernel会先在内存中制造一个rootfs当做 ...

  4. 读取.raw格式文件(学习记录)

    import cv2 #OpenCV包 import numpy as np # 首先确定原图片的基本信息:数据格式,行数列数,通道数 rows=886#图像的行数 cols=492#图像的列数 ch ...

  5. C# 的布尔类型和字符串类型(模板字符串)

    // 布尔类型 boll bool b = false; b = 1 == 1; // true bool b1 = 1 > 23; // false // 值类型 : 在代码中初始化类型的时候 ...

  6. udev简介与使用

    部分参考自: https://www.cnblogs.com/fah936861121/p/6496608.html 什么是udev udev是Linux(linux2.6内核之后)默认的设备管理工具 ...

  7. 云原生爱好者周刊 | 使用 WASM 来写博客是什么感觉?

    开源项目推荐 zzhack zzhack 是一个静态博客框架,是一个纯正的 WASM 应用,它由 Rust & Yew 来作为技术栈进行搭建,UI 设计比较美观,大家也可以直接使用该项目的设计 ...

  8. HTML标签 b 和 strong 的区别

    <b>标签和<strong>标签都表示加粗,效果通常是一样的: <b>:义演丁真<strong>:义演丁真 类似的还有<em>和<i& ...

  9. EXCEL获取拼音首字母

    Excel 2016 按组合键ALT+F11调出VB窗口--插入--模块(复制代码到新模块中,复制完后始可关闭VB窗口) 复制以下代码到模块中 Function getpychar(char) tmp ...

  10. Linux基础-学会使用命令帮助

    概述 使用 whatis 使用 man 查看命令程序路径 which 总结 参考资料 概述 Linux 命令及其参数繁多,大多数人都是无法记住全部功能和具体参数意思的.在 linux 终端,面对命令不 ...