行(row),列(Column),列蔟(Column Family),列标识符(Column Qualifier)和单元格(Cell)

行:由一个个行键(rowkey)和一个多个列组成。其中rowkey是按照字典顺序排序

列:列由列蔟(Column Family)和列限定符(Column Qualifier)组成   例如:C1:ID

列蔟:创建表时就已经创建,是固定的,所有表中的每一行都有相同的列蔟,列蔟和列标识符通过绑定在一起用:连接

列标识符(列名):为存储的values数据提供索引,不同的行可能存在不同的列标识符

单元格:是行、列蔟和列标识符的组合,包含一个值和一个时间戳,以十六进制进制进行显示存储

创建表

首先先启动hbase shell

create '表名','列蔟名'...   (一个表可以包含若干个列蔟)

create 'ORDER_INFO','001'

查看表

list '表名'

删除表(先禁用表才能删除)

disable  '表名 '

drop   '表名'

添加数据

put '表名','ROWKEY','列蔟名(Column Family):列限定符(Column Qualifier)','值'

put 'ORDER_INFO','000001','C1:ID','000001'

put 'ORDER_INFO','000001','C1:STATUS','已提交'

put 'ORDER_INFO','000001','C1:PAY_MONEY',4070

put 'ORDER_INFO','000001','C1:PAYWAY',1

put 'ORDER_INFO','000001','C1:USER_ID',4944191

put 'ORDER_INFO','000001','C1:OPERATION_DATE','2020-04-25 12:09:16'

put 'ORDER_INFO','000001','C1:CATEGORY','手机'

查看添加的数据

get '表名','rowkey'

get 'ORDER_INFO','000001'

get 'ORDER_INFO','000001','C1:ID'

显示中文:get命令最后添加  {FORMATTER => 'toString'}  FORMATTER要大写

查看表结构

describe 'ORDER_INFO'

更新操作

更新指定的列(每执行一次put,时间戳都会发生改变)

put 'ORDER_INFO', '000001', 'C1:STATUS', '已付款'

删除操作

删除指定的列

delete '表名', 'rowkey', '列蔟:列'

delete 'ORDER_INFO','000001','C1:STATUS'

注意:此处HBase默认会保存多个时间戳的版本数据,所以这里的delete删除的是最新版本的列数据。

删除前

删除后

 删除整行数据

deleteall '表名','rowkey'

deleteall 'ORDER_INFO','000001'

清空表

truncate "表名"

truncate 'ORDER_INFO'

扫描操作

scan '表名'  (注意避免扫描大表)

scan 'ORDER_INFO'

扫描前两条

scan 'ORDER_INFO',{LIMIT=>2}

按固定rowkey扫描

hbase(main):079:0> scan 'ORDER_INFO',{ROWPREFIXFILTER=>'000001'}

范围查询 STARTROW(开始rowkey) ENDROW(结束rowkey)

scan 'ORDER_INFO', {STARTROW => 'row2'}

scan 'ORDER_INFO', {STARTROW => 'row2',ENDROW => 'row2'}

scan 'ORDER_INFO', {STARTROW => 'row2',ENDROW => 'row3'}

加载表,统计表记录数,禁用启用表

加载表

在linux中直接执行hbase shell 文件路径   (不要在shell中执行)

统计表记录数

count ‘表名’, {INTERVAL => intervalNum, CACHE => cacheNum} (每intervalNum告诉一次,每次刷cacheNum条)

INTERVAL设置多少行显示一次及对应的rowkey,默认1000;CACHE每次去取的缓存区大小,默认是10,调整该参数可提高查询速度

当有大量数据时可以进行MapReduce程序统计

启动yarn集群

start-yarn.sh

启动history server

mr-jobhistory-daemon.sh start historyserver

执行命令:$HBASE_HOME/bin/hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'ORDER_INFO'

禁用启用表

禁用表:disable ‘表名’

启动表:enable ‘表名’

测试表是否存在:exists ‘表名’

Hbase计数器

要使用incr来初始化一个列,不能用put操作

可以使用get_counter的指令来获取计数器的操作,使用get是获取不到的

get_counter 'NEWS_VISIT_CNT','0000000020_01:00-02:00','C1:CNT'

incr '表名','rowkey','列蔟:列名',xxx(xxx是增加的值,不写就是默认加1)

incr 'NEWS_VISIT_CNT','0000000020_01:00-02:00','C1:CNT',2

shell管理命令

status:显示服务器状态

whoaim:显示HBase当前用户

describe:展示表结构信息

exists:检查表是否存在,适用于表量特别多的情况

Hive整合HBase

create external table students_hbase
(
id string,
name string,
age string,
gender string,
clazz string
)
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
with serdeproperties ("hbase.columns.mapping" = "
:key,
info:name,
info:age,
info:gender,
info:clazz
")
tblproperties("hbase.table.name" = "default:students");

HBase常用shell操作的更多相关文章

  1. HBASE与hive对比使用以及HBASE常用shell操作。与sqoop的集成

    2.6.与 Hive 的集成2.6.1.HBase 与 Hive 的对比1) Hive(1) 数据仓库Hive 的本质其实就相当于将 HDFS 中已经存储的文件在 Mysql 中做了一个双射关系,以方 ...

  2. 原 HBase 常用Shell命令

    HBase 常用Shell命令 1.进入hbase shell console $HBASE_HOME/bin/hbase shell 如果有kerberos认证,需要事先使用相应的keytab进行一 ...

  3. (转)HBase 常用Shell命令

    转自:http://my.oschina.net/u/189445/blog/595232 hbase shell命令                             描述  alter 修改 ...

  4. Hbase之shell操作

    一. 介绍 HBase是一个分布式的.面向列的 开源数据库,源于google的一篇论文<bigtable:一个结构化数据的分布式存储系统>.HBase是Google Bigtable的开源 ...

  5. HBase的Shell操作

    1.进入命令行 bin/hbase shell 2.输入help 查看各种命令组. 命令是分组的,可以执行help 'general'查看general组的命令. 3.常用命令 --显示有哪些表 li ...

  6. HBase 学习之路(五)——HBase常用 Shell 命令

    一.基本命令 打开Hbase Shell: # hbase shell 1.1 获取帮助 # 获取帮助 help # 获取命令的详细信息 help 'status' 1.2 查看服务器状态 statu ...

  7. HBase 系列(五)——HBase 常用 Shell 命令

    一.基本命令 打开 Hbase Shell: # hbase shell 1.1 获取帮助 # 获取帮助 help # 获取命令的详细信息 help 'status' 1.2 查看服务器状态 stat ...

  8. 【hbase】hbase的shell操作笔记

    HBase Shell $ ./bin/hbase shell # 进入交互界面 DDL操作: create:创建表(默认命名空间为default) # create '表名','列族1','列族2' ...

  9. HBase 常用Shell命令

    两个月前使用过hbase,现在最基本的命令都淡忘了,留一个备查~ 进入hbase shell console$HBASE_HOME/bin/hbase shell如果有kerberos认证,需要事先使 ...

随机推荐

  1. Git常用命令(超实用)

    Git常用命令 一.Git常用命令 1.1 创建SSH Key 1.2 仓库 1.3 增加/删除文件 1.4 代码提交 1.5 分支 1.6 标签 1.7 查看信息 1.8 远程同步 1.9 撤销 1 ...

  2. Collection和Map集合

    前言 集合的长度是可变的.集合存储的都是对象.而且对象的类型可以不一致. Collection集合和Map集合是所有集合的父接口. Collection接口定义 体系结构的根接口,代表一组对象,有两个 ...

  3. table 增加或删除一行

    转载请注明来源:https://www.cnblogs.com/hookjc/ <HTML><SCRIPT LANGUAGE="JScript">funct ...

  4. kubeadm/flannel/dashboard/harbor部署以及服务发布

    kubeadm/flannel/dashboard/harbor部署以及服务发布 目录 kubeadm/flannel/dashboard/harbor部署以及服务发布 一.部署kubeadm 1. ...

  5. 虫师Selenium2+Python_11、自动化测试项目实战

    P276 11.1.3 自动化测试用例编写原则 在编写自动化测试用例过程中应该遵循以下原则: 1.一个用例为一个完整的场景,从用户登录系统到最终退出并关闭浏览器: 2.一个用例只能验证一个功能点,不要 ...

  6. ssh一段时间无操作后自动断开连接(假死)问题

    平时使用ssh远程服务器的时候(注:远程虚拟机一般不会有这个问题),一段时间没有操作,ssh连接就会处于假死状态,以至于需要重新进行ssh连接,不管你用的什么远程工具都会出现这个问题,那么通过心跳检测 ...

  7. Springboot整合ElasticSearch进行简单的测试及用Kibana进行查看

    一.前言 搜索引擎还是在电商项目.百度.还有技术博客中广泛应用,使用最多的还是ElasticSearch,Solr在大数据量下检索性能不如ElasticSearch.今天和大家一起搭建一下,小编是看完 ...

  8. Solution -「CF 908D」New Year&Arbitrary Arrangement

    \(\mathcal{Description}\)   Link.   给定 \(n,p_a,p_b\),初始有一个空串,每次操作有 \(\frac{p_a}{p_a+p_b}\) 的概率在其后添加字 ...

  9. [LeetCode]3.无重复字符的最长子串(Java)

    原题地址: longest-substring-without-repeating-characters/submissions 题目描述: 示例 1: 输入: s = "pwwkew&qu ...

  10. JAVA 1.对象和封装

    1. 2. 3.Java类里面属性可以付初使值 4.属性的名字一小写开头 5 6.构造方法 1.语法:       7.staitc的应用  1.statia可以用来修饰:方法,属性,代码块 , st ...