hbase安装

下载 wget http://apache.gree.com/apache/hbase/hbase-1.2.11/hbase-1.2.11-bin.tar.gz

tar -zxvf base-1.2.11-bin.tar.gz -C /usr/local/

mv /ussr/local/hbase-1.2.11  /usr/local/hbase

配置环境

vi /etc/profile

export HBASE_HOME=/usr/local/hbase

export PATH=$HBASE_HOME/bin:$PATH

保存退出

source /etc/profile

编辑HBASE_HOME/conf/hbase-env.sh,添加

export JAVA_HOME=/usr/java/jdk1.8.0_191-amd64/jre

export HBASE_CLASSPATH=/usr/local/hadoop/conf

export HBASE_MANAGES_ZK=false                    不使用hbase自带的zookeeper,使用外部的zookeeper管理hbase

编辑 HBASE_HOME/conf/hbase-site.xml

<configuration>
<property>
<!--设置hbasemaster的主机和端口-->
<name>hbase.master</name>
<value>HDP-master:60000</value>
</property>
<property>
<!-- 设置hbase在HDFS上的存储路径,要与hadoop的core-site.xml中的fs.defaultFS路径一致 -->
<name>hbase.rootdir</name>
<value>hdfs://HDP-master:9000/hbase</value>
</property>
<property>
<!-- 指定hbase是分布式的 -->
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<!-- 指定外部zookeeper地址,多个用‘,’分隔 -->
<name>hbase.zookeeper.quorum</name>
<value>HDP-master,HDP-slave1,HDP-slave2</value>
</property> </configuration>

 编辑HBASE_HOME/conf/regionservers   ,设置hbase的从节点(安装regionserver的节点)添加

HDP-slave1

HDP-slave2

退出保存

hbase集群之间要进行数据同步,除了要配置ssh免密连接之外,还要保证各个服务器的时间一致,所以要配置时间同步

选定一个服务器,将其时间设置为标准时间,进行配置

主服务器 编辑 /etc/chrony.conf 添加

allow 10.2.14.0/24                设置允许哪些网段的机器同步本机时间

local stratum 10                  不去同步任何机器的时间,设置时间同步服务器级别

保存退出

systemctl restart chronyd

从服务器 编辑/etc/chrony.conf

server 0.rhel.pool.ntp.org.iburst

...

server 4.rhel.pool.ntp.org iburst

修改为:

server 10.2.xxx.xx iburst          ip为主服务器的IP,设置同步时间的源服务器

保存退出

重启chronyd

systemctl restart chronyd

 

测试,可通过指令查看各机器时间

watch -n 1 date

更正主服务器时间

date -s 10/24/2019

date -s 17:23:22

要启动hbase,需要先依次启动zookeeper,hadoop

启动zookeeper,集群中每台机子都需要执行

zookeeper/bin/zkServer.sh start

zookeeper/bin/zkServer.sh status

启动hadoop(仅需在主节点执行)

sbin/start-all.sh

启动hbase(仅需在主节点执行)

/usr/local/hbase/bin/start-hbase.sh

hbase启动后在master用jps查看时是 HMaster ,在slave上是HRegionServer进程

在命令行 执行hbase shell即可以进入hbase的shell

list                      列出所有的hbase表

describe table_name       查看表结构

scan table_name           遍历表中的数据

get table_name, rowkey    查看表中主键为rowkey的一行数据

get table_nmae,rowkey,column:qualifier   查看表中指定行,指定列簇的指定列的值

get table_name,rowkey,{COLUMN => 'colum_name',TIMESTAMP => 15555699956861,FILTER =>"QualifierFilter(=, 'binary:Gil/0/31')"}  查看表中指定rowkey指定列簇中符合条件的列的数据

hbase相关操作的更多相关文章

  1. Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作

    Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作 1.sparkstreaming实时写入Hbase(saveAsNewAPIHadoopDataset方法 ...

  2. HBase相关的一些点

    1.在运行Hbase时,如果遇到出错之后: 可以通过{HBASE_HOME}目录,我的是在/usr/soft/hbase下的logs子目录中的日志文件查看错误原因.2.启动关闭Hadoop和HBase ...

  3. 从零自学Hadoop(20):HBase数据模型相关操作上

    阅读目录 序 介绍 命名空间 表 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  4. 从零自学Hadoop(21):HBase数据模型相关操作下

    阅读目录 序 变量 数据模型操作 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  5. HBase 相关API操练(三):MapReduce操作HBase

    MapReduce 操作 HBase 在 HBase 系统上运行批处理运算,最方便和实用的模型依然是 MapReduce,如下图所示. HBase Table 和 Region 的关系类似 HDFS ...

  6. HBase相关

    hadoop和hbase节点添加和单独重启 有时候hadoop或hbase集群运行时间久了后,某些节点就会失效,这个时候如果不想重启整个集群(这种情况在很多情况下已经不被允许),这个时候可以单独重启失 ...

  7. 【甘道夫】HBase基本数据操作的详细说明【完整版,精绝】

    介绍 之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...

  8. 从零自学Hadoop(24):Impala相关操作上

    阅读目录 序 数据库相关 表相关 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  9. hbase简单操作

    hbase有hbase shell以及hbase 客户端api两种方式进行hbase数据库操作: 首先,hbase shell是在linux命令行进行操作,输入hbase shell命令,进入shel ...

随机推荐

  1. Spark中持久化和序列化学习

    一.cache和persisit的对比 -rw-r--r--@ 1 hadoop staff 68M 5 17 07:04 access.log    cache/persitence是 laz ...

  2. 并发编程 ~~~ 多进程~~~进程创建的两种方式, 进程pid, 验证进程之间的空间隔离, 进程对象join方法, 进程对象其他属性

    一 进程创建的两种方式 from multiprocessing import Process import time def task(name): print(f'{name} is runnin ...

  3. ubuntu 或centos 使用Docker搭建anaconda+python基本环境

    ubuntu 16 使用Docker安装anacondaubuntu docker 安装centos docker 安装搜索可用镜像 docker search anaconda 拉取你中意的镜像 d ...

  4. Master Note for Transportable Tablespaces (TTS) -- Common Questions and Issues (Doc ID 1166564.1)

    APPLIES TO: Oracle Database Cloud Exadata Service - Version N/A and laterOracle Database Cloud Servi ...

  5. QT新建空白项目-添加QT设计师界面类时出现的各种库无法导入识别

    按照教材上先新建一个空的项目--添加Qt设计师界面类时 出现各种 库无法识别 解决方法: 在 .pro文件中加入一行 QT += widgets 去构建中先执行 qmake 然后再构建一下  ok了 ...

  6. Paper | Adaptive Computation Time for Recurrent Neural Networks

    目录 1. 网络资源 2. 简介 3. 自适应运算时间 3.1 有限运算时间 3.2 误差梯度 1. 网络资源 这篇文章的写作太随意了,读起来不是很好懂(掺杂了过多的技术细节).因此有作者介绍会更好. ...

  7. python--numpy生成正态分布数据及randint randn normal的使用

    正太分布:也叫(高斯分布Gaussian distribution),是一种随机概率分布 机器学习中numpy.random如何生成这样的正态分布数据,本篇博客记录这样的用法 import numpy ...

  8. CPU参数指标说明

    %user %user表示CPU一共花了多少比例的时间运行在用户态空间或者说是用户进程(running user space processes) 典型的用户态空间程序有:Shells.数据库.web ...

  9. 【分布式架构】--- 基于Redis组件的特性,实现一个分布式限流

    分布式---基于Redis进行接口IP限流 场景 为了防止我们的接口被人恶意访问,比如有人通过JMeter工具频繁访问我们的接口,导致接口响应变慢甚至崩溃,所以我们需要对一些特定的接口进行IP限流,即 ...

  10. C#关闭多线程程序

    Process[] processes = System.Diagnostics.Process.GetProcesses(); //获得所有进程 foreach (Process p in proc ...