HBase详解(02) - HBase-2.0.5安装

HBase安装环境准备

  • Zookeeper安装

Zookeeper安装参考《Zookeeper详解(02) - zookeeper安装部署-单机模式-集群模式》

启动Zookeeper集群

bin/zkServer.sh start

  • Hadoop安装

Hadoop安装参考《Hadoop详解(02) - Hadoop3.1.3集群运行环境搭建》

启动Hadoop集群

sbin/start-dfs.sh

sbin/start-yarn.sh

Hbase安装

  • 安装包下载

HBase官网:https://hbase.apache.org/

Hbase安装包历史版本下载地址:https://archive.apache.org/dist/hbase/

hbase-2.0.5下载地址:https://archive.apache.org/dist/hbase/2.0.5/hbase-2.0.5-bin.tar.gz

  • 上传解压

将Hbase安装包hbase-2.0.5-bin.tar.gz上传到服务器的/opt/software目录

解压:

[hadoop@hadoop102 software]$ tar -zxvf hbase-2.0.5-bin.tar.gz -C /opt/module/

重命名

[hadoop@hadoop102 software]$ cd /opt/module/

[hadoop@hadoop102 module]$ mv hbase-2.0.5/ hbase

  • 修改配置文件hbase-env.sh

[hadoop@hadoop102 module]$ cd hbase/conf/

[hadoop@hadoop102 conf]$ vi hbase-env.sh

修改内容:

#使用独立的Zookeeper集群,找到如下内容,放开注释,将值修改为false

export HBASE_MANAGES_ZK=false

  • 修改配置文件hbase-site.xml

[hadoop@hadoop102 conf]$ vi hbase-site.xml

添加如下内容:

<configuration>

<property>

<name>hbase.rootdir</name>

<value>hdfs://hadoop102:9820/hbase</value>

</property>

<property>

<name>hbase.cluster.distributed</name>

<value>true</value>

</property>

<property>

<name>hbase.zookeeper.quorum</name>

<value>hadoop102,hadoop103,hadoop104</value>

</property>

</configuration>

注意:hbase.rootdir配置的端口为Hadoop namenode端口,即与hadoop中core-site.xml的fs.defaultFS值配置的端口一致

  • 修改regionservers

[hadoop@hadoop102 conf]$ vi regionservers

删除原来的内容,添加如下内容,表示需要启动的Region Server节点

hadoop102

hadoop103

hadoop104

  • 分发安装包

将HBase安装包分发到其他集群

[hadoop@hadoop102 module]$ scp -r hbase/ hadoop103:/opt/module/

[hadoop@hadoop102 module]$ scp -r hbase/ hadoop104:/opt/module/

  • 配置环境变量

[hadoop@hadoop102 module]$ sudo vi /etc/profile

在文件末尾添加如下内容

#HBASE_HOME

export HBASE_HOME=/opt/module/hbase

export PATH=$PATH:$HBASE_HOME/bin

注意:在hadoop103,hadoop104上也需要配置HBase的环境变量

  • 启动Hbase集群

[hadoop@hadoop102 hbase]$ cd /opt/module/hbase/

[hadoop@hadoop102 hbase]$ bin/start-hbase.sh

停止服务:

[hadoop@hadoop102 hbase]$ bin/stop-hbase.sh

  • 查看Hbase UI页面

浏览器中访问http://hadoop102:16010

提示:如果集群之间的节点时间不同步,会导致regionserver无法启动,抛出ClockOutOfSyncException异常。

解决方法:

方法一:同步时间服务

方法二:设置属性:hbase.master.maxclockskew设置更大的值

<property>

<name>hbase.master.maxclockskew</name>

<value>180000</value>

<description>Time difference of regionserver from master</description>

</property>

  • 单点启动命令

bin/hbase-daemon.sh start master

bin/hbase-daemon.sh start regionserver

HMaster高可用(可选)

在HBase中HMaster负责监控HRegionServer的生命周期,均衡RegionServer的负载,如果HMaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对HMaster的高可用配置。

  • 关闭HBase集群(如果没有启动Hbase集群则跳过此步)

[hadoop@hadoop102 hbase]$ bin/stop-hbase.sh

  • 在conf目录下创建backup-masters文件

[hadoop@hadoop102 hbase]$ touch conf/backup-masters

  • 在backup-masters文件中配置高可用HMaster节点

[hadoop@hadoop102 hbase]$ echo hadoop103 > conf/backup-masters

  • 将conf目录scp到其他节点

[hadoop@hadoop102 hbase]$ scp -r conf/ hadoop103:/opt/module/hbase/

[hadoop@hadoop102 hbase]$ scp -r conf/ hadoop104:/opt/module/hbase/

  • 启动HBase集群

[hadoop@hadoop102 hbase]$ bin/start-hbase.sh

  • 打开页面测试查看

http://hadooo102:16010

访问备份节点的HMaster:http://hadoop103:16010

HBase Shell操作

基本操作

1.进入HBase客户端命令行

[hadoop@hadoop102 hbase]$ bin/hbase shell

2.查看帮助命令

hbase(main):001:0> help

namespace的操作

1.查看当前Hbase中有哪些namespace

hbase(main):002:0> list_namespace

NAMESPACE

default(创建表时未指定命名空间的话默认在default下)

hbase(系统使用的,用来存放系统相关的元数据信息等,勿随便操作)

2.创建namespace

hbase(main):010:0> create_namespace "test"

hbase(main):010:0> create_namespace "test01", {"author"=>"wyh", "create_time"=>"2020-03-10 08:08:08"}

3.查看namespace

hbase(main):010:0> describe_namespace "test01"

4.修改namespace的信息(添加或者修改属性)

hbase(main):010:0> alter_namespace "test01", {METHOD => 'set', 'author' => 'weiyunhui'}

添加或者修改属性:

alter_namespace 'ns1', {METHOD => 'set', 'PROPERTY_NAME' => 'PROPERTY_VALUE'}

删除属性:

alter_namespace 'ns1', {METHOD => 'unset', NAME => ' PROPERTY_NAME '}

5.删除namespace

hbase(main):010:0> drop_namespace "test01"

注意: 要删除的namespace必须是空的,其下没有表。

表的操作

0.查看当前数据库中有哪些表

hbase(main):002:0> list

1.创建表

hbase(main):002:0> create 'student','info'

2.插入数据到表

hbase(main):003:0> put 'student','1001','info:sex','male'

hbase(main):004:0> put 'student','1001','info:age','18'

hbase(main):005:0> put 'student','1002','info:name','Janna'

hbase(main):006:0> put 'student','1002','info:sex','female'

hbase(main):007:0> put 'student','1002','info:age','20'

3.扫描查看表数据

hbase(main):008:0> scan 'student'

hbase(main):009:0> scan 'student',{STARTROW => '1001', STOPROW => '1001'}

hbase(main):010:0> scan 'student',{STARTROW => '1001'}

4.查看表结构

hbase(main):011:0> describe 'student'

5.更新指定字段的数据

hbase(main):012:0> put 'student','1001','info:name','Nick'

hbase(main):013:0> put 'student','1001','info:age','100'

6.查看"指定行"或"指定列族:列"的数据

hbase(main):014:0> get 'student','1001'

hbase(main):015:0> get 'student','1001','info:name'

7.统计表数据行数

hbase(main):021:0> count 'student'

8.删除数据

删除某rowkey的全部数据:

hbase(main):016:0> deleteall 'student','1001'

删除某rowkey的某一列数据:

hbase(main):017:0> delete 'student','1002','info:sex'

9.清空表数据

hbase(main):018:0> truncate 'student'

提示:清空表的操作顺序为先disable,然后再truncate。

10.删除表

首先需要先让该表为disable状态:

hbase(main):019:0> disable 'student'

然后才能drop这个表:

hbase(main):020:0> drop 'student'

提示:如果直接drop表,会报错:ERROR: Table student is enabled. Disable it first.

11.变更表信息

将info列族中的数据存放3个版本:

hbase(main):022:0> alter 'student',{NAME=>'info',VERSIONS=>3}

hbase(main):022:0> get 'student','1001',{COLUMN=>'info:name',VERSIONS=>3}

HBase详解(02) - HBase-2.0.5安装的更多相关文章

  1. 大数据入门第十四天——Hbase详解(一)入门与安装配置

    一.概述 1.什么是Hbase 根据官网:https://hbase.apache.org/ Apache HBase™ is the Hadoop database, a distributed, ...

  2. [转帖]HBase详解(很全面)

    HBase详解(很全面) very long story 简单看了一遍 很多不明白的地方.. 2018-06-08 16:12:32 卢子墨 阅读数 34857更多 分类专栏: HBase   [转自 ...

  3. 图解大数据 | 海量数据库查询-Hive与HBase详解

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...

  4. Linux 下Redis集群安装部署及使用详解(在线和离线两种安装+相关错误解决方案)

    一.应用场景介绍 本文主要是介绍Redis集群在Linux环境下的安装讲解,其中主要包括在联网的Linux环境和脱机的Linux环境下是如何安装的.因为大多数时候,公司的生产环境是在内网环境下,无外网 ...

  5. RabbitMQ详解(一)------简介与安装(Docker)

    RABBITMQ详解(一)------简介与安装(DOCKER) 刚刚进入实习,在学习过程中没有接触过MQ,RabbitMQ 这个消息中间件,正好公司最近的项目中有用到,学习了解一下. 首先什么是MQ ...

  6. 大数据学习day11------hbase_day01----1. zk的监控机制,2动态感知服务上下线案例 3.HDFS-HA的高可用基本的工作原理 4. HDFS-HA的配置详解 5. HBASE(简介,安装,shell客户端,java客户端)

    1. ZK的监控机制 1.1 监听数据的变化  (1)监听一次 public class ChangeDataWacher { public static void main(String[] arg ...

  7. HBase详解

    1.   hbase简介 1.1.  什么是hbase HBASE是一个高可靠性.高性能.面向列.可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群. H ...

  8. Hive集成HBase详解

    摘要 Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询 插入操作以及进行Join和Union等复杂查询   应用场景 1. 将ETL操作的数据存入HBase 2. HB ...

  9. Linux用户、用户组权限管理详解 --- 02

    2,用户.用户组管理操作详解: 2.1 adduser 添加用户: adduser [-u uid][-g group][-d home][-s shell] -u:直接给出userID        ...

  10. 图文详解压力测试工具JMeter的安装与使用

    压力测试是目前大型网站系统的设计和开发中不可或缺的环节,通常会和容量预估等工作结合在一起,穿插在系统开发的不同方案.压力测试可以帮助我们及时发现系统的性能短板和瓶颈问题,在这个基础在上再进行针对性的性 ...

随机推荐

  1. Kafka之安装

    Kafka之安装 一.下载kafka 此博客只讲述kafka0.8和kafka1.0两个版本 更改kafka下的/home/bigdata/kafka/config/server.properties ...

  2. 驱动开发:Win10内核枚举SSDT表基址

    三年前面朝黄土背朝天的我,写了一篇如何在Windows 7系统下枚举内核SSDT表的文章<驱动开发:内核读取SSDT表基址>三年过去了我还是个单身狗,开个玩笑,微软的Windows 10系 ...

  3. Windows docker环境安装

    前期准备 1.hyper-v功能 win10家庭版没有提供hyper-v的问题可通过如下脚本解决,保存为bat并运行重启电脑即可. pushd "%~dp0" dir /b %Sy ...

  4. Unexpected token u in JSON at position 0

    文章目录 1.1 错误原因: 1.2 解决思路: 1.1 错误原因: 因为JSON.parse()不能解析字符串中的undefined 出错的结果:某一行的这个字段的值为空,就会报错,整个表格都显示不 ...

  5. LeetCode------合并两个有序数组(4)【数组】

    来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/merge-sorted-array 1.题目 给你两个按 非递减顺序 排列的整数数组 nums ...

  6. 齐博x1模板中常用的TP标签数据处理

    上图是比较常用的, 而下图是比较特殊的场合,比如幻灯片可能会用到 下图使用了TP的循环标签. 上图只使用了条件判断标签 上图不存在 val="xxx" 这个参数,所以会自动循环输出 ...

  7. 45.限流Throttling及源码解析

    什么是限流? 限流类似于权限机制,它也决定是否接受当前请求,用于控制客户端在某段时间内允许向API发出请求的次数,也就是频率 假设有客户端(比如爬虫程序)短时间发起大量请求,超过了服务器能够处理的能力 ...

  8. 洛P8109题解

    摘自本人洛谷博客,原文章地址:https://www.luogu.com.cn/blog/cjtb666anran/solution-p8109 本题原题目摘录: 本场比赛共有 \(n\) 道题,Ci ...

  9. 对于python中“FileNotFoundError: [Errno 2] No such file or directory”的解决办法

    在我们使用vscode运行Python代码时遇到的情况 一.出现原因:这里是由于Vscode中,python里的路径是相对与工作目录来进行定位的.所以在多级目录情况下,若不设置绝对路径,往往找不到相应 ...

  10. JIRA操作之JQL

    搜索功能 Jira的搜索功能非常强大,有专用的搜索语言JQL(Jira Query Language).Jira的Python库是基于JQL语法搜索的,返回的是搜索到的问题列表. jira.searc ...