hadoop之hbase基本操作
hbase shell 进入hbase命令行
list 显示HBASE表
status 系统上运行的服务器的细节和系统的状态
version 返回HBase系统使用的版本
table_help 引导如何使用表引用的命令
whoami 返回当前HBase用户
# 建表
create 'base_test','personal data','professional data'
disable 'emp' 禁用表 enable可以重新启用
is_disabled 'table name' 查看表是否被禁用
disable_all 'r.*' 禁用一系列表
describe 'emp' 表描述
alter 't1', NAME => 'f1', VERSIONS => 5 单元的最大数目设置为5
# 使用alter,可以设置和删除表范围,运算符,如MAX_FILESIZE,READONLY,MEMSTORE_FLUSHSIZE,DEFERRED_LOG_FLUSH等。
alter 'emp', READONLY 设置表为只读
alter 't1', METHOD => 'table_att_unset', NAME => 'MAX_FILESIZE'
alter 'table name', 'delete'=> 'column family'
# 删除列簇
alter 'employee','delete'=>'professional'
exists 'emp' 判断表是否存在
drop 'emp' 删除表,删除表之前必须先禁用表
drop_all 't.*' 批量删除
put 'emp','','personal data:name','raju' 插入数据
put 'emp','','personal data:city','hyderabad'
put 'emp','','personal data:city','Delhi' 更新row=1,personal data=city数据的值为Delhi
get 'emp', '' 查询数据
get 'emp', '', {COLUMN=>'personal data:name'} 查询指定行、指定列
delete 'emp', '', 'personal data:city' 删除数据
deleteall 'emp','' 删除所有数据
count 'emp' 统计表的行数
truncate 'table name' 禁止删除并重新创建一个表
grant <user> <permissions> [<table> [<column family> [<column; qualifier>]]
R - 代表读取权限
W - 代表写权限
X - 代表执行权限
C - 代表创建权限
A - 代表管理权限
grant 'Tutorialspoint', 'RWXCA'
revoke命令用于撤销用户访问表的权限
revoke 'Tutorialspoint'
user_permission 'emp' 列出了emp表的所有用户权限。 # 新增列簇要先声明
disable 'emp'
alter 'emp', NAME => 'daily', VERSIONS =>1
enable 'emp'
# 为新列簇加入数据
put 'emp','2017-11-30','module:headline',''
put 'emp','2017-11-30','module:community',''
put 'emp','2017-11-30','module:car',''
put 'emp','2017-11-30','module:service',''
put 'emp','2017-11-30','module:my',''
put 'emp','2017-12-01','module:headline',''
put 'emp','2017-12-01','module:community',''
put 'emp','2017-12-01','module:car',''
put 'emp','2017-12-01','module:service',''
put 'emp','2017-12-01','module:my','' # 查询数据——通过rowkey
get 'emp','2017-12-01' # 查询数据——通过rowkey+columnkey
get 'emp','2017-12-01',{COLUMN => 'basic:active'}
get 'emp','2017-12-01','basic:login'
get 'emp','2017-12-01',{COLUMN => 'basic:active', TIMESTAMP => 1513218051477}
get 'emp','2017-12-01',{COLUMN => 'basic:active', TIMESTAMP => 1513218051477,VERSIONS => 1}
# 查询数据——通过rowkey+多个columnkey
get 'emp','2017-12-01',{COLUMN =>['basic:active','basic:newadd']} # 查询数据——通过rowkey+family
get 'emp','2017-12-01','basic' # 查询行数
count 'emp'
# 删除正行
deleteall 'emp','row1' # 按columkey查询
scan 'emp',{COLUMN => 'basic:active'}
scan 'emp',{COLUMN => ['basic:active','basic:newadd'],LIMIT => 2} # rowkey模糊查询
scan 'emp',{FILTER=>org.apache.hadoop.hbase.filter.PrefixFilter.new(org.apache.hadoop.hbase.util.Bytes.toBytes('2017-12'))} # 通过时间戳查询
scan 'emp',{TIMERANGE =>[1513218313453,1513218314019]}
# rowkey模糊查询——前缀过滤
scan 'emp',{ FILTER => "PrefixFilter ('2017-11')"}
# 查询rowkey中包含'12-0'的
import org.apache.hadoop.hbase.filter.CompareFilter
import org.apache.hadoop.hbase.filter.SubstringComparator
import org.apache.hadoop.hbase.filter.RowFilter
scan 'emp', {FILTER => RowFilter.new(CompareFilter::CompareOp.valueOf('EQUAL'), SubstringComparator.new('12-0'))}
# 查询rowkey 从2017-12-01开始,到2017-12-04截止,包含前不包含后
scan 'emp', {STARTROW=>'2017-12-01', STOPROW=>'2017-12-04'}
# 查询columnkey中前缀是'lo'
scan 'emp', FILTER=>"ColumnPrefixFilter('lo')"
# 查询value中包含''的
scan 'emp', FILTER=>"ValueFilter(=,'substring:57')" # 计数器
incr 'emp', '2017-12-01', 'daily:hits', 1
incr 'emp', '2017-12-01', 'daily:hits'
# 获取计数器
get_counter 'emp', '2017-12-01', 'daily:hits' 将hdfs上的数据push到hbase中
hadoop fs -put -f '/data/bglogs/databoardshells/app_ctr.txt' /tmp/hbase-input/
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,ctr:c_key,ctr:show,ctr:click app_client /tmp/hbase-input/app_ctr.txt
hadoop之hbase基本操作的更多相关文章
- Hadoop HA高可用集群搭建(Hadoop+Zookeeper+HBase)
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果 一.服务器环境 主机名 IP 用户名 密码 安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
- 使用ganglia监控hadoop及hbase集群
一.Ganglia简介 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点.每台计算机都运行一个收集和发送度量数据(如处理器速度.内存使用量等)的名为 gm ...
- hadoop +zookeeper + hbase 单节点安装
项目描述: 今天花了680元买了阿里云的一台内存1G, 带宽1M 的云主机. 想以后方便测试用,而且想把自己的博客签到自己的主机上.所以自己就搭了一个测试的环境. 可以用来进行基本的hbase 入库, ...
- Hadoop 之Hbase命令
一.常用命令:(hbase shell 进入终端) 1.创建表: create 'users','user_id','address','info' 表users,有三个列族user_id,addre ...
- 使用Ganglia监控hadoop、hbase
Ganglia是一个监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标. Ganglia的强大在于:g ...
- spring hadoop 访问hbase入门
1. 环境准备: Maven Eclipse Java Spring 版本 3..2.9 2. Maven pom.xml配置 <!-- Spring hadoop --> <d ...
- hadoop、hbase、hive、zookeeper版本对应关系
本文引用自:http://www.aboutyun.com/blog-61-62.html 最新版本: hadoop和hbase版本对应关系: Hbase Hadoop 0.92.0 1.0.0 ...
- hadoop中hbase出现的问题
在安装hbase中出现问题如下: ERROR: Can't get master address from ZooKeeper; znode data == null 解决办法: 1.删除nameno ...
- hadoop浅尝 hadoop与hbase交互
在安装好hbase之后,运行一个与hadoop无关的纯hbase程序成功了. 接着写一个hadoop与hbase进行交互的小程序,这个程序的运行方法依然与前文相同, 即导出jar文件在shell下运行 ...
随机推荐
- 读取和修改xml文件
如有一个xml文件DownData.xml,内容如下 <?xml version="1.0" standalone="yes"?> <Root ...
- 安卓手机可以连上wifi但无法上网的解决办法
作者:朱金灿 来源:http://blog.csdn.net/clever101 前晚我的安卓手机还可以连接wifi上网,昨晚显示已经连接,但是死活打不开网页.于是到网上查了下,发现要将原来的DHCP ...
- 常用编程软件站点、镜像站、科技类 PDF
0. 图书站点 Library Genesis 1. Python 包的下载 https://pypi.python.org/pypi/ 在域名的最后加上任何你想下载的第三方的包,比如 theano: ...
- 学术论文写作的 paper、code 资源
(机器学习/计算机视觉/深度学习)代码 0. 核心期刊 Best paper awards at - CV NIPS: JMLR COLT & ICML(每年度的官网) 1. Computin ...
- yii联查
$count = Acticle::find()->select("acticle_type.act_type,acticle.act_id,acticle.act_title,act ...
- 详解第一个CUDA程序kernel.cu
CUDA是一个基于NVIDIA GPU的并行计算平台和编程模型,通过调用CUDA提供的API,可以开发高性能的并行程序.CUDA安装好之后,会自动配置好VS编译环境,按照UCDA模板新建一个工程&qu ...
- 图灵机(Turing Machine)
图灵机,又称图灵计算.图灵计算机,是由数学家阿兰·麦席森·图灵(1912-1954)提出的一种抽象计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人们进行数学运算. 所谓的图 ...
- USER_AGENT 知识
USER-AGENT 是 Http 协议中的一部分,属于头域的组成部分,User Agent也简称 UA,意为用户代理,当用户通过浏览器发送 http 请求时,USER_AGENT 起到表明自己身份的 ...
- Android程序猿必掌握的sqlite数据库连表查询
SQL查询的基本原理:两种情况介绍. 第一. 单表查询:依据WHERE条件过滤表中的记录,形成中间表(这个中间表对用户是不可见的):然后依据SELECT的选择列选择对应的列进行返回终于结果. 第二 ...
- python 教程 第十三章、 特殊的方法
第十三章. 特殊的方法 1) 特殊的方法 __init__(self,...) 这个方法在新建对象恰好要被返回使用之前被调用. __del__(self) 恰好在对象要被删除之前调用. __st ...