Hbase的数据结构

基本要素:命名空间、表、行、列、单元格,region,时间戳。

1.命名空间:NameSpaces的作用

Table:表,所有的表都是命名空间的成员,即表必属于某个命名空间,如果没有指定,则在default默认的命名空间中。

RegionServer group:一个命名空间包含了默认的RegionServer Group。

Permission:权限,命名空间能够定义访问控制列表ACL(Access Control List)。例如,创建表,读取表,删除,更新等等操作。

Quota:限额,可以强制一个命名空间可包含的region的数量。

2.表:概念上可以理解为关系型数据库的表。

3.行:行键rowkey是行的唯一标识元素,表中的数据存储根据行键进行排序,数据的访问也是通过行键进行。

4.列:(列族:列名)表中的每个列,都归属于某个列族,列族是表的schema的一部分(列不是),必须在使用表之前定义,列名都以列族作为前缀;例如info:name,info:age,info:class都属于info这个列族。

5.单元格: 单元格cell中存放的是不可分割的字节数组,每个单元格拥有版本信息,插入数据时若没有设置版本,则为默认版本。

6.region:region将表水平划分,是Hbase集群分布数据的最小单位,在线的所有区域就构成了表的内容。

7.时间戳:Hbase 中每个 cell都保存着同一份数据的多个版本,版本通过时间戳来索引,插入数据时可以设置时间戳的值,若未设置则生成默认时间戳。

Hbase的Shell操作


在任意节点主机上使用hbase shell即可连接到已经启动的Hbase实例:

  1 # hbase shell



输入help可以显示帮助文档内容,status可以查看Hbase集群状态:

  1 > help





status提供HBase的状态:

  1 > status



version提供正在使用Hbase版本:

  1 > version



create用于创建表,创建时必须指定表名和ColumnFamily名称:

  1 > create 'testtable','infofamily'



list用于查看HBase中所有的表:

  1 > list



describe命令可以查看某个表的信息:

  1 > describe 'testtable'



alter用于修改一个表,例如添加列族:

  1 > alter 'testtable',NAME=>'basic'

使用describe命令查看添加列族后的表信息:



使用alter命令删除列族:

  1 > alter 'testtable',NAME=>'basic','METHOD'=>'delete'



使用disable命令可以禁用表,在做删除表或其他的操作时,需要在表禁用的情况下才能进行操作,使用enable命令可以将禁用的表格重新启用:

  1 > disable 'testtable'
  1 > enable 'testtable'



使用drop命令可以删除已经禁用的表(必须先disable表,否则会报出错误提示):

  1 > disable 'testtable'
2 > drop 'testtable'





再创建一个表testtableone:

  1 > create 'testtableone','info'

使用put命令可以向表中添加数据,put命令格式:

  1 > put '表名','行键','列族:列名','VALUE'
  1 > put 'testtableone','row1','info:name','Jack'



使用get命令可以看某行数据信息:

  1 > get 'testtableone','row1'



使用scan可以查看表中所有行的数据信息:

  1 > scan 'testtableone'



delete用于删除表中的单元格值,delete命令格式:

  1 > delete '表名','行键','列族:列名',时间戳

先往表中多插入几条数据。

注意:此处在插入数据时,先插入的row2行数据Bob,由于在后续插入数据时,行键row2没有更改,所以Bob数据直接被Lucy替换了。





删除Jack的class单元格数据:

  1 > delete 'testtableone','row1','info:class',1566182654321



deleteall用于删除给定行的所有单元格:

  1 > delete '表名','行键'

删除row1行的所有单元格数据:

  1 > deleteall 'testtableone','row1'



count用于计数并返回表中的行的数值:

  1 > count 'testtableone'



至此常用的命令列举完成。

Hbase数据结构和shell操作的更多相关文章

  1. Hbase快速开始——shell操作

    一. 介绍 HBase是一个分布式的.面向列的开源数据库,源于google的一篇论文<bigtable:一个结构化数据的分布式存储系统>.HBase是Google Bigtable的开源实 ...

  2. HBase(四)HBase集群Shell操作

    一.进入HBase命令行 在你安装的随意台服务器节点上,执行命令:hbase shell,会进入到你的 hbase shell 客 户端 [admin@node21 ~]$ hbase shell S ...

  3. HBase学习之路 (三)HBase集群Shell操作

    进入HBase命令行 在你安装的随意台服务器节点上,执行命令:hbase shell,会进入到你的 hbase shell 客 户端 [hadoop@hadoop1 ~]$ hbase shell S ...

  4. Hbase(二)【shell操作】

    目录 一.基础操作 1.进入shell命令行 2.帮助查看命令 二.命名空间操作 1.创建namespace 2.查看namespace 3.删除命名空间 三.表操作 1.查看所有表 2.创建表 3. ...

  5. Hbase的常见shell操作

    1.带namespace的:https://blog.csdn.net/opensure/article/details/46470969 2.http://www.cnblogs.com/xing9 ...

  6. 大数据技术之_11_HBase学习_01_HBase 简介+HBase 安装+HBase Shell 操作+HBase 数据结构+HBase 原理

    第1章 HBase 简介1.1 什么是 HBase1.2 HBase 特点1.3 HBase 架构1.3 HBase 中的角色1.3.1 HMaster1.3.2 RegionServer1.3.3 ...

  7. Hbase之shell操作

    一. 介绍 HBase是一个分布式的.面向列的 开源数据库,源于google的一篇论文<bigtable:一个结构化数据的分布式存储系统>.HBase是Google Bigtable的开源 ...

  8. HBase(3)-安装与Shell操作

    一. 安装 1. 启动Zookeeper集群 2. 启动Hadoop集群 3. 上传并解压HBase -bin.tar.gz -C /opt/module 4. 修改配置文件 #修改habse-env ...

  9. HBASE与hive对比使用以及HBASE常用shell操作。与sqoop的集成

    2.6.与 Hive 的集成2.6.1.HBase 与 Hive 的对比1) Hive(1) 数据仓库Hive 的本质其实就相当于将 HDFS 中已经存储的文件在 Mysql 中做了一个双射关系,以方 ...

随机推荐

  1. 【nginx+keepalived】nginx+keepalived搭建高可用

    一.结构及环境 1.1 环境介绍 操作系统:centos7 nginx+keepalived:106.53.73.200 master nginx+keepalived:182.254.184.102 ...

  2. 在Join中使用FIND_IN_SET

    $d['a.cold'] = 2; $d['b.PostId'] = $up_id['PostId']; $d['b.F_Id'] = $up_id['Id']; $d['WorkinTime'] = ...

  3. 在命令提示符下,运行Java程序时,提示"找不到或无法加载主类"

    小白:在命令提示符下,运行Java程序时,提示"找不到或无法加载主类". 大神:运行Java程序的作用是让Java解释器装载,检验并运行字节码文件(.class).因此,在运行Ja ...

  4. 【iOS翻译】对UIGestureRecognizer多种手势傻傻分不清

    UIGestureRecognizerDelegate A set of methods implemented by the delegate of a gesture recognizer to ...

  5. 使用百度大脑iOCR,快速自定义机票行程单模板识别

    1. 功能介绍百度已经推出了iOCR财会票据识别,针对财会报销场景提出的专项解决方案,可对各类财务票据.报销单.银行回单.对账单进行自动分类及结构化识别,并支持用户为固定版式的新票据/单据自定义结构化 ...

  6. redis系列之------链表

    前言 链表提供了高效的节点重排能力, 以及顺序性的节点访问方式, 并且可以通过增删节点来灵活地调整链表的长度. 作为一种常用数据结构, 链表内置在很多高级的编程语言里面, 因为 Redis 使用的 C ...

  7. Shell命令的执行优先级

    Shell内置命令.外部命令.别名.函数.保留关键字的优先级 在Shell中,有5种可调用的东西:别名(alias).函数(function).shell保留关键字.shell内置命令.外部命令. 如 ...

  8. CEF编译 执行gn args out\Release_GN_x86异常

    gn args out\Debug_GN_x86 用来配置编译参数,执行gn args out\Release_GN_x86时异常: Toolchain is out of date. Run &qu ...

  9. centos安装go环境

    centos安装go环境 1,下载合适的go安装包 https://studygolang.com/dl 2 上传到 centos服务器的 /usr/local下然后解压 3.设置go的环境变量    ...

  10. Larave中CSRF攻击

    1.什么是CSRF攻击?            CSRF是跨站请求伪造(Cross-site request forgery)的英文缩写\          Laravel框架中避免CSRF攻击很简单 ...