hbase相关操作

hbase安装

下载 wget http://apache.gree.com/apache/hbase/hbase-1.2.11/hbase-1.2.11-bin.tar.gz

tar -zxvf base-1.2.11-bin.tar.gz -C /usr/local/

mv /ussr/local/hbase-1.2.11 /usr/local/hbase

配置环境

vi /etc/profile

export HBASE_HOME=/usr/local/hbase

export PATH=$HBASE_HOME/bin:$PATH

保存退出

source /etc/profile

编辑HBASE_HOME/conf/hbase-env.sh,添加

export JAVA_HOME=/usr/java/jdk1.8.0_191-amd64/jre

export HBASE_CLASSPATH=/usr/local/hadoop/conf

export HBASE_MANAGES_ZK=false 不使用hbase自带的zookeeper，使用外部的zookeeper管理hbase

编辑 HBASE_HOME/conf/hbase-site.xml

<configuration>

<property>

    <!--设置hbasemaster的主机和端口-->

    <name>hbase.master</name>

    <value>HDP-master:60000</value>

</property>

<property>

    <!-- 设置hbase在HDFS上的存储路径，要与hadoop的core-site.xml中的fs.defaultFS路径一致 -->

    <name>hbase.rootdir</name>

    <value>hdfs://HDP-master:9000/hbase</value>

</property>

<property>

    <!-- 指定hbase是分布式的 -->

    <name>hbase.cluster.distributed</name>

    <value>true</value>

</property>

<property>

    <!-- 指定外部zookeeper地址，多个用‘，’分隔 -->

    <name>hbase.zookeeper.quorum</name>

    <value>HDP-master,HDP-slave1,HDP-slave2</value>

</property>

</configuration>

　编辑HBASE_HOME/conf/regionservers ,设置hbase的从节点（安装regionserver的节点）添加

HDP-slave1

HDP-slave2

退出保存

hbase集群之间要进行数据同步，除了要配置ssh免密连接之外，还要保证各个服务器的时间一致，所以要配置时间同步

选定一个服务器，将其时间设置为标准时间，进行配置

主服务器编辑 /etc/chrony.conf 添加

allow 10.2.14.0/24 设置允许哪些网段的机器同步本机时间

local stratum 10 不去同步任何机器的时间，设置时间同步服务器级别

保存退出

systemctl restart chronyd

从服务器编辑/etc/chrony.conf

将

server 0.rhel.pool.ntp.org.iburst

...

server 4.rhel.pool.ntp.org iburst

修改为：

server 10.2.xxx.xx iburst ip为主服务器的IP，设置同步时间的源服务器

保存退出

重启chronyd

systemctl restart chronyd

测试，可通过指令查看各机器时间

watch -n 1 date

更正主服务器时间

date -s 10/24/2019

date -s 17:23:22

要启动hbase，需要先依次启动zookeeper,hadoop

启动zookeeper,集群中每台机子都需要执行

zookeeper/bin/zkServer.sh start

zookeeper/bin/zkServer.sh status

启动hadoop（仅需在主节点执行）

sbin/start-all.sh

启动hbase(仅需在主节点执行）

/usr/local/hbase/bin/start-hbase.sh

hbase启动后在master用jps查看时是 HMaster ,在slave上是HRegionServer进程

在命令行执行hbase shell即可以进入hbase的shell

list 列出所有的hbase表

describe table_name 查看表结构

scan table_name 遍历表中的数据

get table_name, rowkey 查看表中主键为rowkey的一行数据

get table_nmae,rowkey,column:qualifier 查看表中指定行，指定列簇的指定列的值

get table_name,rowkey,{COLUMN => 'colum_name',TIMESTAMP => 15555699956861,FILTER =>"QualifierFilter(=, 'binary:Gil/0/31')"} 查看表中指定rowkey指定列簇中符合条件的列的数据

hbase相关操作的更多相关文章

Spark-读写HBase，SparkStreaming操作，Spark的HBase相关操作
Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作 1.sparkstreaming实时写入Hbase(saveAsNewAPIHadoopDataset方法 ...
HBase相关的一些点
1.在运行Hbase时,如果遇到出错之后: 可以通过{HBASE_HOME}目录,我的是在/usr/soft/hbase下的logs子目录中的日志文件查看错误原因.2.启动关闭Hadoop和HBase ...
从零自学Hadoop(20)：HBase数据模型相关操作上
阅读目录序介绍命名空间表系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
从零自学Hadoop(21)：HBase数据模型相关操作下
阅读目录序变量数据模型操作系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
HBase 相关API操练(三)：MapReduce操作HBase
MapReduce 操作 HBase 在 HBase 系统上运行批处理运算,最方便和实用的模型依然是 MapReduce,如下图所示. HBase Table 和 Region 的关系类似 HDFS ...
HBase相关
hadoop和hbase节点添加和单独重启有时候hadoop或hbase集群运行时间久了后,某些节点就会失效,这个时候如果不想重启整个集群(这种情况在很多情况下已经不被允许),这个时候可以单独重启失 ...
【甘道夫】HBase基本数据操作的详细说明【完整版，精绝】
介绍之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...
从零自学Hadoop(24)：Impala相关操作上
阅读目录序数据库相关表相关系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
hbase简单操作
hbase有hbase shell以及hbase 客户端api两种方式进行hbase数据库操作: 首先,hbase shell是在linux命令行进行操作,输入hbase shell命令,进入shel ...

随机推荐

Spark中持久化和序列化学习
一.cache和persisit的对比 -rw-r--r--@ 1 hadoop staff 68M 5 17 07:04 access.log cache/persitence是 laz ...
并发编程 ~~~ 多进程~~~进程创建的两种方式, 进程pid, 验证进程之间的空间隔离, 进程对象join方法, 进程对象其他属性
一进程创建的两种方式 from multiprocessing import Process import time def task(name): print(f'{name} is runnin ...
ubuntu 或centos 使用Docker搭建anaconda+python基本环境
ubuntu 16 使用Docker安装anacondaubuntu docker 安装centos docker 安装搜索可用镜像 docker search anaconda 拉取你中意的镜像 d ...
Master Note for Transportable Tablespaces (TTS) -- Common Questions and Issues (Doc ID 1166564.1)
APPLIES TO: Oracle Database Cloud Exadata Service - Version N/A and laterOracle Database Cloud Servi ...
QT新建空白项目-添加QT设计师界面类时出现的各种库无法导入识别
按照教材上先新建一个空的项目--添加Qt设计师界面类时出现各种库无法识别解决方法: 在 .pro文件中加入一行 QT += widgets 去构建中先执行 qmake 然后再构建一下 ok了 ...
Paper | Adaptive Computation Time for Recurrent Neural Networks
目录 1. 网络资源 2. 简介 3. 自适应运算时间 3.1 有限运算时间 3.2 误差梯度 1. 网络资源这篇文章的写作太随意了,读起来不是很好懂(掺杂了过多的技术细节).因此有作者介绍会更好. ...
python--numpy生成正态分布数据及randint randn normal的使用
正太分布:也叫(高斯分布Gaussian distribution),是一种随机概率分布机器学习中numpy.random如何生成这样的正态分布数据,本篇博客记录这样的用法 import numpy ...
CPU参数指标说明
%user %user表示CPU一共花了多少比例的时间运行在用户态空间或者说是用户进程(running user space processes) 典型的用户态空间程序有:Shells.数据库.web ...
【分布式架构】--- 基于Redis组件的特性，实现一个分布式限流
分布式---基于Redis进行接口IP限流场景为了防止我们的接口被人恶意访问,比如有人通过JMeter工具频繁访问我们的接口,导致接口响应变慢甚至崩溃,所以我们需要对一些特定的接口进行IP限流,即 ...
C#关闭多线程程序
Process[] processes = System.Diagnostics.Process.GetProcesses(); //获得所有进程 foreach (Process p in proc ...

hbase相关操作

hbase相关操作的更多相关文章

随机推荐

热门专题