一个学生成绩表的例子来演示hbase的用法。

name grade course
math english
Tom 5 97 87
Jim 4 89 80

表的创建:语法:create '表名称','列簇名称1','列簇名称2'........

create 'student','name','grade','course'
desc 'student'

结果:

{
NAME=>'course',
DATA_BLOCK_ENCODING=>'NONE',
BLOOMFILTER=>'ROW',
REPLICATION_SCOPE=>'',
VERSIONS=>'',
COMPRESSION=>'NONE',
MIN_VERSIONS=>'',
TTL=>'FOREVER',
KEEP_DELETED_CELLS=>'FALSE',
BLOCKSIZE=>'',
IN_MEMORY=>'false',
BLOCKCACHE=>'true'
}{
NAME=>'grade',
DATA_BLOCK_ENCODING=>'NONE',
BLOOMFILTER=>'ROW',
REPLICATION_SCOPE=>'',
VERSIONS=>'',
COMPRESSION=>'NONE',
MIN_VERSIONS=>'',
TTL=>'FOREVER',
KEEP_DELETED_CELLS=>'FALSE',
BLOCKSIZE=>'',
IN_MEMORY=>'false',
BLOCKCACHE=>'true'
}{
NAME=>'name',
DATA_BLOCK_ENCODING=>'NONE',
BLOOMFILTER=>'ROW',
REPLICATION_SCOPE=>'',
VERSIONS=>'',
COMPRESSION=>'NONE',
MIN_VERSIONS=>'',
TTL=>'FOREVER',
KEEP_DELETED_CELLS=>'FALSE',
BLOCKSIZE=>'',
IN_MEMORY=>'false',
BLOCKCACHE=>'true'
}

新增列簇:

alter '表名称',NAME='列簇名称'

hbase(main):068:0> alter 'student',NAME=>'age'
Updating all regions with the new schema...
1/1 regions updated.

删除列簇:

alter '表名称',NAME=>'列簇名称',METHOD=>'delete'

 alter 'student',NAME=>'test',METHOD=>'delete'

删除一个表:之前,必须先将该表disable掉。

disable 'student'

drop 'student'

给表添加记录:

put '表名称','rowkey','列簇名称:列名称','值'

put 'student','','name','Tom'

结果:

hbase(main):085:0> scan 'student'
ROW COLUMN+CELL
001201509011001 column=name:, timestamp=1447766388162, value=Tom
1 row(s) in 0.0090 seconds

继续执行:name列簇的value='jim',但是rowkey 不变,

hbase(main):086:0> put 'student','','name','Jim'

结果还是一条数据,001201509011001的rowkey,被第二条数据覆盖。

scan 'student'
ROW COLUMN+CELL
001201509011001 column=name:, timestamp=1447766492893, value=Jim
put 'student','','course:math',''
put 'student','001201509011001','course:english','100'
hbase(main):096:0> scan 'student'
ROW COLUMN+CELL
001201509011001 column=course:english, timestamp=1447766828720, value=100
001201509011001 column=course:math, timestamp=1447766813289, value=100
001201509011001 column=grade:, timestamp=1447766751652, value=2
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=name:, timestamp=1447766547713, value=Tom

加了很多rowKey进行测试:如下

base(main):127:0> scan 'student'
ROW COLUMN+CELL
001201509011001 column=course:english, timestamp=1447766828720, value=100
001201509011001 column=course:math, timestamp=1447766813289, value=100
001201509011001 column=grade:, timestamp=1447766751652, value=2
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=course:english, timestamp=1447766987607, value=95
001201509011002 column=course:math, timestamp=1447767003501, value=80
001201509011002 column=grade:, timestamp=1447767073299, value=6
001201509011002 column=name:, timestamp=1447766547713, value=Tom
001201509011003 column=grade:, timestamp=1447767130750, value=5
001201509011004 column=grade:, timestamp=1447767139371, value=3
001201509011005 column=grade:, timestamp=1447767146338, value=3
001201509011006 column=course:math, timestamp=1447767489278, value=30
001201509011006 column=grade:, timestamp=1447767153088, value=2
001201509011007 column=course:math, timestamp=1447767474245, value=87
001201509011007 column=grade:, timestamp=1447767173296, value=2
001201509011008 column=grade:, timestamp=1447767181639, value=3
001201509011008 column=name:, timestamp=1447767278902, value=lucy
001201509011009 column=grade:, timestamp=1447767190450, value=10
001201509011009 column=name:, timestamp=1447767257259, value=Mike
001201509011010 column=grade:, timestamp=1447767198644, value=11
001201509011010 column=name:, timestamp=1447767236548, value=Peter

根据rowkey查看对应列的数据:

get '表名称','rowkey','列簇名称:列名称'

 get 'student','','name'
COLUMN                        CELL
name: timestamp=1447766492893, value=Jim

查看表中的记录数:根据列簇来统计:

hbase(main):133:0* count 'student'

结果:10

查询表中指定列的所有记录:

语法:scan '表名',{COLUMNS =>'列簇'}

hbase(main):134:0> scan 'student',{COLUMNS=>'name'}
ROW                           COLUMN+CELL
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=name:, timestamp=1447766547713, value=Tom
001201509011008 column=name:, timestamp=1447767278902, value=lucy
001201509011009 column=name:, timestamp=1447767257259, value=Mike
001201509011010 column=name:, timestamp=1447767236548, value=Peter
hbase(main):135:0> scan 'student',{COLUMNS=>'grade'}
ROW COLUMN+CELL
001201509011001 column=grade:, timestamp=1447766751652, value=2
001201509011002 column=grade:, timestamp=1447767073299, value=6
001201509011003 column=grade:, timestamp=1447767130750, value=5
001201509011004 column=grade:, timestamp=1447767139371, value=3
001201509011005 column=grade:, timestamp=1447767146338, value=3
001201509011006 column=grade:, timestamp=1447767153088, value=2
001201509011007 column=grade:, timestamp=1447767173296, value=2
001201509011008 column=grade:, timestamp=1447767181639, value=3
001201509011009 column=grade:, timestamp=1447767190450, value=10
001201509011010 column=grade:, timestamp=1447767198644, value=11
10 row(s) in 0.0220 seconds
hbase(main):136:0> scan 'student',{COLUMNS=>'course'}
ROW COLUMN+CELL
001201509011001 column=course:english, timestamp=1447766828720, value=100
001201509011001 column=course:math, timestamp=1447766813289, value=100
001201509011002 column=course:english, timestamp=1447766987607, value=95
001201509011002 column=course:math, timestamp=1447767003501, value=80
001201509011006 column=course:math, timestamp=1447767489278, value=30
001201509011007 column=course:math, timestamp=1447767474245, value=87
4 row(s) in 0.0130 seconds

查询表中指定区间的所有记录数:

也可以指定一些修饰词:TIMERANGE, FILTER, LIMIT, STARTROW, STOPROW, TIMESTAMP, MAXLENGTH,or COLUMNS。没任何修饰词,就是上边例句,就会显示所有数据行。

语法:scan '表名',{COLUMNS =>'列簇',LIMIT =>记录数,STARTROW=>'开始rowkey',STOPROW=>'结束rowkey'}

取出name列族,前3条记录

hbase(main):012:0> scan 'student',{COLUMNS=>['name'],LIMIT=>3}
ROW COLUMN+CELL
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=name:, timestamp=1447766547713, value=Tom
001201509011008 column=name:, timestamp=1447767278902, value=lucy

取出name列族,前3条记录 rowkey[001201509011001,) 左边闭合,右边开的数据。

hbase(main):014:0> scan 'student',{COLUMNS=>['name'],LIMIT=>3,STARTROW=>'',STOPROW=>''}
ROW COLUMN+CELL
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=name:, timestamp=1447766547713, value=Tom

指定两列:name,grade

hbase(main):018:0> scan 'student',{COLUMNS=>['name','grade'],STARTROW=>'',STOPROW=>''}
ROW                           COLUMN+CELL
001201509011001 column=grade:, timestamp=1447766751652, value=2
001201509011001 column=name:, timestamp=1447766492893, value=Jim
001201509011002 column=grade:, timestamp=1447767073299, value=6
001201509011002 column=name:, timestamp=1447766547713, value=Tom
001201509011003 column=grade:, timestamp=1447767130750, value=5
001201509011004 column=grade:, timestamp=1447767139371, value=3
001201509011005 column=grade:, timestamp=1447767146338, value=3
001201509011006 column=grade:, timestamp=1447767153088, value=2
001201509011007 column=grade:, timestamp=1447767173296, value=2
001201509011008 column=grade:, timestamp=1447767181639, value=3
001201509011008 column=name:, timestamp=1447767278902, value=lucy
001201509011009 column=grade:, timestamp=1447767190450, value=10
001201509011009 column=name:, timestamp=1447767257259, value=Mike

可以根据 TIMERANGE查询:

hbase(main):020:0> scan 'student',{COLUMNS=>['grade'],LIMIT => 3,TIMERANGE=>[1447766751652,1447767257259]}
ROW                           COLUMN+CELL
001201509011001 column=grade:, timestamp=1447766751652, value=2
001201509011002 column=grade:, timestamp=1447767073299, value=6
001201509011003 column=grade:, timestamp=1447767130750, value=5

删除数据:

rowkey= 的数据有4列

hbase(main):024:0> get 'student',''
COLUMN CELL
course:english timestamp=1447766987607, value=95
course:math timestamp=1447767003501, value=80
grade: timestamp=1447767073299, value=6
name: timestamp=1447766547713, value=Tom

删除一行数据:

hbase(main):027:0> delete 'student','001201509011002','grade'
hbase(main):028:0> get 'student',''
COLUMN CELL
course:english timestamp=1447766987607, value=95
course:math timestamp=1447767003501, value=80
name: timestamp=1447766547713, value=Tom

查看那一行的数据:发现没有了。

hbase(main):033:0> scan 'student',{COLUMNS=>['grade'],STARTROW=>'',STOPROW=>''}
ROW COLUMN+CELL
0 row(s) in 0.0080 seconds

http://www.cnblogs.com/ggjucheng/p/3379607.html  参考:HBase shell的基本用法

http://blog.csdn.net/u010967382/article/category/2387735 参考 HBase基本数据操作详解【完整版,绝对精品】

 
 
 
 

hbase shell学习-2的更多相关文章

  1. 大数据学习路线分享-Hbase shell的基本操作完整流程

    HBase的命令行工具,最简单的接口,适合HBase管理使用,可以使用shell命令来查询HBase中数据的详细情况.安装完HBase之后,启动hadoop集群(利用hdfs存储),启动zookeep ...

  2. Hadoop学习笔记之HBase Shell语法练习

    Hadoop学习笔记之HBase Shell语法练习 作者:hugengyong 下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称 命令 ...

  3. HBase学习笔记2 - HBase shell常用命令

    转载请标注原链接:http://www.cnblogs.com/xczyd/p/6639397.html 扫表的时候限定行数 scan } 即为扫表的时候,限定只输出五条数据 ============ ...

  4. 大数据技术之_11_HBase学习_01_HBase 简介+HBase 安装+HBase Shell 操作+HBase 数据结构+HBase 原理

    第1章 HBase 简介1.1 什么是 HBase1.2 HBase 特点1.3 HBase 架构1.3 HBase 中的角色1.3.1 HMaster1.3.2 RegionServer1.3.3 ...

  5. HBase学习2(HBase shell)

    HBase 常用命令 查看当前用户:whoami 创建表:create '表名', '列族名1','列族名2','列族名N' 查看所有表:list 描述表: describe '表名' 判断表存在: ...

  6. Hbase深入学习(六) Java操作HBase

    Hbase深入学习(六) ―― Java操作HBase 本文讲述如何用hbase shell命令和hbase java api对hbase服务器进行操作. 先看以下读取一行记录hbase是如何进行工作 ...

  7. Hbase深入学习(二) 安装hbase

    Hbase深入学习(二) 安装hbase This guidedescribes setup of a standalone hbase instance that uses the local fi ...

  8. 执行HBase shell时出现ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet错误解决办法(图文详解)

    不多说,直接上干货! [kfk@bigdata-pro01 bin]$ jps NameNode ResourceManager JournalNode HMaster DataNode HRegio ...

  9. Hadoop学习---Hadoop的HBase的学习

    Hbase Hbase的特点: Hbase是bigtable的开源的仿制版本 建立在HDFS之上 可靠性,靠性能 大:一个表可以有上亿行,上百万列 面向列:面向列(族)的存储和权限控制,列(族)独立检 ...

随机推荐

  1. 服务器上装filezilla server后,本地的ftp客户端连接不上去

    公司一台服务器,上面装了filezilla server后,按平常配置好了,但是在本地用FTP客户端不管怎么连接都连接不上,本地FTP客户端总提示连接失败,远程filezilla server的界面也 ...

  2. 对Android的恶意吐槽(勿看,有毒)

    CSDN博客:http://blog.csdn.net/niu_gao 我觉得android系统中有一个特恶心人的大败笔.就是这个大败笔造成了android系统的卡卡卡不停. 这个大败笔就是对acti ...

  3. Mongodb查询引用

    var result = db.users.findOne({"name":"Tom Wu"},{"address_ids":1,_id:0 ...

  4. Memory Analyzer tool(MAT)分析内存泄漏---理解Retained Heap、Shallow Heap、GC Root

    Shallow Heap Size 指对象自身所占用的内存大小,不包含其引用的对象所占的内存大小. 1.数组类型 数组元素对象所占内存的大小总和. 2.非数组类型 对象与它所有的成员变量大小的总和.当 ...

  5. Mysql修改时间的年月日,时分秒保持不变语句

    比如时间为 “2015-01-05 14:32:21” 修改为“2015-01-06 14:32:21” 修改内容为修改yyyy-mm-dd为对应的日期,时间不变. HOUR,TIME(StatusU ...

  6. Oracle中文字符乱码?设置Oracle客户端字符编码与服务端一致

    经常可能出现查询Oracle数据时,中文显示乱码,这很可能是因为,Oracle服务端的字符编码与客户端不一致引起的. 这时,我们需要做的是,如何设置自己的客户端字符编码与服务端一致. 查询Oracle ...

  7. pairRDD中算子reduceByKeyLocally

    原型: def reduceByKeyLocally(func: (V, V) => V): Map[K, V] 该函数将RDD[K,V]中每个K对应的V值根据映射函数来运算,运算结果映射到一个 ...

  8. python下RSA加密解密以及跨平台问题

    Reference:  http://www.cnblogs.com/luchanghong/archive/2012/07/18/2596886.html 项目合作需要,和其他网站通信,消息内容采用 ...

  9. hive 定时加载分区

    #!/bin/bash #每天定时位外部表加载分区 #服务器当天的时间 #加载环境变量 source /etc/profile; #如果没有指定日期用当前日期如果指定的日期使用指定的日期 echo ' ...

  10. 搭建一个单纯学习hibernate的项目

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/20 ...