HBase学习记录-API】的更多相关文章

delete.addColumns()和delete.addColumn()的区别 /** * delete.addColumns(); * delete.addColumn(); * 区别: * addColumn是删除某一个列簇里的最新时间戳版本. * 传时间戳,则删除指定版本 * addColumns是删除某个列簇里的所有时间戳版本.其如果修改数据后, 不进行flush或没到flush事件,则会出现旧数据的出现:造成数据未修改彻底未删除彻底 * 传时间戳,可删除指定版本,如果没有指定版本的…
HBaseConfiguration HBaseConfiguration是每一个hbase client都会使用到的对象,它代表的是HBase配置信息.它有两种构造方式: public HBaseConfiguration() public HBaseConfiguration(final Configuration c) 默认的构造方式会尝试从hbase-default.xml和hbase-site.xml中读取配置.如果classpath没有这两个文件,就需要你自己设置配置. Config…
概述 Hbase –Haddop Database 是一个高性能,高可靠性.面向列.可伸缩的分布式存储系统. Hbase利用HDFS作为文件存储系统,利用MapReduce来处理Hbase的海量数据,利用Zookeeper作为协调工具. 是NoSQL的一种. 数据模型 表(table),是用来存储管理数据的,是在schema声明的时候定义 行健(row key),类似于MySQL中的主键,与MySQL不同的是Hbase表天然自带的. 可以是字符串.整数.二进制串.串行化的结构. 按照字典顺序由低…
说明: 公司最近要使用HBase 用于(冷)历史数据 存储,和简单离线计算.在一次讨论会上,我发表意见,为什么把近期数据流程热点数据库中,并且继续异步流入到 历史数据库HBase 里面.提供高效查询等超做操作使用热点数据,允许等待时间的业务查询历史数据存储.分业务场景来处理.有人说,HBase在修改上非常不好,所以只能是完结数据迁移!我非常不理解.所以近期就看 了一下书籍.现在做一些记录.由于需要学的太多,至少关注了一下关键环节. PS: 关系型数据库和HBase 这种NOSql数据 来说说非常…
HBase 使用docker搭建参考https://blog.csdn.net/baifanwudi/article/details/78498325 搭建好以后,网页端可以看到: terminal 界面 HBase是一种构建在HDFS之上的分布式.面向列的存储系统.在需要实时读写,随机访问超大规模数据集时,可以使用HBase. HBase的特点 1.大,一个表可以有上一行,上百万行. 2.面向列:面向列表(簇)的存储和权限控制,列(簇)独立检索. 3.稀疏:对于为空(NULL)的列,并不占用存…
查看表结构 describe '表名' 查看版本 get '表名','zhangsan'{COLUMN=>'info:age',VERSIONS=>3} 删除整行 deleteall '表名' 清空表 truncate '表名' 关闭表 disable '表名' 开启表 enbale '表名' 添加列族 alter '表名',{NAME=>'f2',VERSIONS=>3} //添加前需要先关闭表,完成操作后再开启 hbase(main):001:0> alter 'log1…
HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行                       ----首先感谢网络能够给我提供一个开放的学习平台,如果没有网上的技术爱好者提供的帮助,很难学好hbase. 一.hbase简介        官方:HBase – Hadoop Database,是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群.        自己的理解:hbase其实就是一个在…
Hbase学习(三)过滤器 HBase 的基本 API,包括增.删.改.查等. 增.删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan). HBase 不仅提供了这些简单的查询,而且提供了更加高级的过滤器(Filter)来查询. 过滤器可以根据列族.列.版本等更多的条件来对数据进行过滤, 基于 HBase 本身提供的三维有序(行键,列,版本有序),这些过滤器可以高效地完成查询过滤的任务,带有过滤器条件的…
HBase1. hbase.id记录了集群的唯一标识:hbase.version记录了文件格式的版本号2. split和.corrupt目录在日志分裂过程中使用,以便保存一些中间结果和损坏的日志在表目录下,为该表的每一个region单独创建一个目录,目录的名字为region name的MD5哈希值3. 二级索引方案:a.Coprocessor b.由客户端发起对于主表和索引表的Put.Delete操作的双重操作 Split和Conpact优化 快速写入 1.写入前 预分Region 2.数据写入…
转自:http://www.aboutyun.com/thread-8391-1-1.html 问题导读: 1.hbase是什么? 2.hbase原理是什么? 3.hbase使用中会遇到什么问题? 4.如何通过eclipse,操作hbase? 5.hbase经常和哪些软件一起使用? .......... hbase从入门到编程 认识hbase 1.hbase简介hbase我们或许已经知道了它是nosql,但是什么是nosql,我们不太清楚,nosql是一种基于列的数据库,而我们的传统数据库则是基…