【HBase】表模型和基本操作介绍

HBase表模型

创建一个hbase表，必须要有表名和列族名

列族 —— columnFamily，就是上图中的Column Family1 userInfo store1 store2、Column Family2 addressInfo store3等

列 —— column，就相当于mysql和hive中的字段名称，图中name、age、address、regtime等都是列。每一个列必然归属于某一个列族

rowKey —— 行键，类似于mysql表中的主键

timeStamp —— 每条数据产生的时间戳

versionNum —— 每条数据当前的版本

cell —— 单元格，就是hbase表中的数据值

常用Shell操作

进入hbase客户端命令操作界面

bin/hbase shell

会出现下图，在hbase(main):001:0>后输入命令即可
查看帮助命令

help
查看当前数据库中有哪些表

list
创建一张表

create 'user','info','data' 表名为user，列族为info、data

还有一种写法 create 'user',{NAME => 'info', VERSIONS => 3},{NAME => 'data'}
添加数据

以下均为向user表中插入数据

一、向 列族info 中添加 name列，并插入 rowKey 为 rk0001，值为 zhangsan 的数据

put 'user','rk0001','info:name','zhangsan'

二、向 列族info 中添加 gender列，并插入 rowKey 为 rk0001，值为 female 的数据

put 'user','rk0001','info:gender','female'

三、向 列族info 中添加 age列，并插入 rowKey 为 rk0001，值为 20 的数据

put 'user','rk0001','info:age',20

四、向 列族data 中添加 pic列，并插入 rowKey 为 rk0001，值为 picture 的数据

put 'user','rk0001','data:pic','picture'
查询数据

HBase的查询比较脆弱，不支持SELECT * FROM tbl_name、LEFT JOIN

第一种查询方式： get rowKey —— 通过rowKey直接获取数据，效率最高

第二种查询方式： scan startRowKey endRowKey —— 根据rowKey的范围值进行查询，rowKey是按照字典顺序进行排列

第三种查询方式： scan tbl_name —— 全表扫描，一般没人用

查询实例：

1.利用 get 查询数据：

(1) get 'user','rk0001' 查询rowKey为rk0001的所有信息

(2) get 'user','rk0001','info' 查询rowKey为rk0001，info列族的所有信息，如果要查多个列族，在后面追加即可：get 'user','rk0001','info','data'

(3) get 'user','rk0001','info:name','info:age' 查询rowKey为rk0001，info列族中name列和age列的所有信息，查询列族中列的信息还有两种写法：get 'user', 'rk0001', {COLUMN => ['info', 'data']} / get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']}，但是一般查询带有rowKey数值时，都可以用第一种最简便的写法，怎么简便易懂易复用怎么来

(4) get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"} 使用过滤器，ValueFilter 是用来查询值的过滤器，binary 意思是二进制，使用过滤器还可以进行模糊查询，比如查询列名中含有字母’a’的数据：get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

2.利用 scan 查询数据：

(1) scan 'user', {COLUMNS => 'info'} 查询user表中info列族的数据，如果要查询多个列族，在后面追加即可：scan 'user', {COLUMNS => ['info', 'data']}

(2) scan 'user', {COLUMNS => ['info:name', 'data:pic']} 查询列族中某个列名的信息

(3) scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5} VERSIONS指的是表中数据的版本号，这里是查询最近5个版本的数据

(4) scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"} 模糊查询，查询info和data列族中列名含有字母’a’的数据

(5) scan 'people', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'} 范围查询，查询info列族中rk0001到rk0003之间的数据，除了可以指定rowKey的范围，还可以指定时间戳的范围：scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}

(6) scan 'user',{FILTER=>"PrefixFilter('rk')"} 查询rowKey中以’rk’开头的字母，Perfix是前缀的意思
更新数据

1.更新数据和添加数据的命令一样，如果没有数据则添加，有数据则更新

2.alter 'user', NAME => 'info', VERSIONS => 5 更新info列族的版本号

3.删除数据

(1) delete 'user', 'rk0001', 'info:name' 删除user表中rowKey为rk0001，info列族中name列的数据，还可以在后面追加更多的属性来指定更精确的数据，比如时间戳：delete 'user', 'rk0001', 'info:name', 1392383705316

(2) alter 'user', NAME => 'f1', METHOD => 'delete' / alter 'user', 'delete' => 'f1' 两个命令都是删除一个列族

(3) truncate 'user' 清空表数据

4.删除表，首先要先禁用表：disable 'user'，然后才能删除表：drop 'user'
显示服务器状态

status 'host_name'
显示HBase当前用户

whoami
统计指定表数据有多少条

count 'tbl_namer'
展示表结构信息

describe 'tbl_name'
检查表是否存在

exist 'tbl_name'
查看表是启用状态还是禁用状态

is_enabled 'tbl_name' 是否启用

is_disabled 'tbl_name' 是否禁用

【HBase】表模型和基本操作介绍的更多相关文章

Hbase:简单介绍一下Hbase表的结构
HBase 是一个NoSQL数据库,用于处理海量数据,可以支持10亿行百万列的大表,下面我就和大家分享一下数据是如何存放在HBase表中的为了更好的理解HBase表的思路,先回顾一下关系数据库中表的 ...
数据分页处理系列之二：HBase表数据分页处理
HBase是Hadoop大数据生态技术圈中的一项关键技术,是一种用于分布式存储大数据的列式数据库,关于HBase更加详细的介绍和技术细节,朋友们可以在网络上进行搜寻,笔者本人在接下来的日子里也会写 ...
hbase操作（shell 命令，如建表，清空表，增删改查）以及 hbase表存储结构和原理
两篇讲的不错文章 http://www.cnblogs.com/nexiyi/p/hbase_shell.html http://blog.csdn.net/u010967382/article/de ...
HBase表数据分页处理
HBase表数据分页处理 HBase是Hadoop大数据生态技术圈中的一项关键技术,是一种用于分布式存储大数据的列式数据库,关于HBase更加详细的介绍和技术细节,朋友们可以在网络上进行搜寻,笔者本人 ...
HBase存储及读写原理介绍
一.HBase介绍及其特点 HBase是一个开源的非关系型分布式数据库,它参考了谷歌的BigTable建模,实现的编程语言为Java.它是Apache软件基金会的Hadoop项目的一部分,运行于HDF ...
HBase(三): Azure HDInsigt HBase表数据导入本地HBase
目录: hdfs 命令操作本地 hbase Azure HDInsight HBase表数据导入本地 hbase hdfs命令操作本地hbase: 参见 HDP2.4安装(五):集群及组件安装 , ...
ThinkPHP 的模型使用详细介绍--模型的核心(七)
原文:ThinkPHP 的模型使用详细介绍--模型的核心(七) 注意:本节是ThinkPhp框架对数据操作的核心处理部分大家还是在这里看清楚可以将其剪切放到代码编辑器中查看本章节给大家着重介绍模型 ...
SQLALchemy中关于复杂关系表模型的映射处理
映射在第五步,我们还是一步一步来哈一. 关系介绍举一个比较经典的关系,部门与员工(以下是我的需求情况,算是把该有的关系都涉及到了) 1.每个部门会有很多成员(这里排除一个成员属于多个部门的情况) ...
hbase表的高性能设计
第7章 HBase优化 7.1 高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷 ...

随机推荐

Vue中el-form标签中的自定义el-select下拉框标签
页面写死el-select下拉框标签: 通过v-for="item in stateArr"绑定,stateArr声明在Vue组件里面的data参数里面代码如下: <el-f ...
Geber文件，装配图，BOM表的输出
一.Geber文件的输出步骤: 注:选择需要导出的层注:所指箭头的地方都多加个零,让输出有更大的空间来容纳总结:这就是最终的Geber文件了二.NC Drill file的输出: 三.IPC ...
day02,静态库和动态库
一.首先我们来看一下什么是静态库和动态库,在这之前我们来看一下编译成可执行文件的过程: 1.静态库(.a..lib):就是在使用的时候会把代码复制到文件中: 它的优点:独立,在链接后不需要静态库源文件 ...
使用pandas读取csv文件和写入文件
这是我的CSV文件读取其中得tempo这一列 import pandas as pd #导入pandas包 data = pd.read_csv("E:\\毕设\\情感识别\\Music- ...
Salesforce元数据入门指南，管理员必看！
元数据是Salesforce基础架构的核心,是Salesforce中的核心组件或功能.没有元数据,大部分功能都无法实现. 但是,某些Salesforce管理员仍然很难掌握元数据的整个范围,并且无法充分 ...
小说免费看！python爬虫框架scrapy 爬取纵横网
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 风,又奈何 PS:如有需要Python学习资料的小伙伴可以加点击下方 ...
SpringBoot连接Redis服务出现DENIED Redis is running in protected mode because protected mode is enabled
修改redis.conf,yes 改为 no
overload 与override的区别
Override 是重写: 方法名称.参数个数,类型,顺序,返回值类型都是必须和父类方法一致的.它的关系是父子关系Overload 是重载: 方法名称不变,其余的都是可以变更的.它的关系是同一个类 ...
TortoiseSVN的使用,以及冲突解决办法
接下来,试试用TortoiseSVN修改文件,添加文件,删除文件,以及如何解决冲突等. 添加文件在检出的工作副本中添加一个Readme.txt文本文件,这时候这个文本文件会显示为没有版本控制的状态, ...
5. class--extends
ES5: function article(x,y){ this.x = x; this.y = y; } article.prototype.say = function() { return (t ...

【HBase】表模型和基本操作介绍

目录

HBase表模型

常用Shell操作

【HBase】表模型和基本操作介绍的更多相关文章

随机推荐

热门专题