HBase集群安装及集成

Hbase集群搭建

注意：在安装hbase或者hadoop的时候，要注意hadoop和hbase的对应关系。如果版本不对应可能造成系统的不稳定和一些其他的问题。在hbase的lib目录下可以看到hadoop对应jar文件，默认情况下hbase下lib的jar文件对应hadoop的相对稳定的版本。如果需要使用其他的hadoop版本，需要将hbase lib下的hadoopjar包，替换掉需要使用的hadoop版本

		HMaster			HRegionServer

Hadoop1		√

Hadoop2		√				√

Hadoop3						√

Hadoop4						√

配置步骤
在hadoop安装目录下找到hadoop-env.sh文件
添加:export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/opt/hbase-2.0.2/lib/*

1、时间同步（必须进行时间同步）

2、配置hbase-env.sh
export JAVA_HOME=/opt/jdk1.8
export HBASE_MANAGES_ZK=false --如果你是使用hbase自带的zk就是true，如果使用自己的zk就是false

3、配置hbase-site.xml

  <configuration>

        <property>

                <!-- 指定 hbase 在 HDFS 上存储的路径 -->

                <name>hbase.rootdir</name>

                <value>hdfs://集群的名字/hbase</value>

        </property>

        <property>

                <!-- 指定 hbase 是分布式的 -->

                <name>hbase.cluster.distributed</name>

                <value>true</value>

        </property>

        <property>

                <!-- 指定 zk 的地址，多个用“,”分割 -->

                <name>hbase.zookeeper.quorum</name>

             <value>hadoop1:2181,hadoop2:2181,hadoop3:2181,hadoop4:2181</value>

        </property>

</configuration>

4、配置backup-masters（需要手动创建）

bigdata@hadoop1:/opt/hbase-2.0.2/conf$ vim backup-masters
文件中写hadoop2（第二个节点的映射名）

5、修改regionservers

vim regionservers

hadoop1

hadoop2

hadoop3

hadoop4

6、将hadoop中的hdfs-site.xml和core-site.xml复制到hbase的conf目录（因为存储数据需要hdfs）

7、将hbase文件夹分发到其他各个节点

8、配置各个节点的hbase环境变量

9、启动zookeeper、启动hdfs、

10、启动hbase（start-hbase.sh）

start-hbase.sh，在哪台节点上执行此命令，哪个节点就是主节点
然后在 backup-masters 文件中配置的备节点上再启动一个 master 主进程

========================================================

1、hbase批量导入数据的命令：

 hbase   org.apache.hadoop.hbase.mapreduce.ImportTsv

 -Dimporttsv.separator=,

 -Dimporttsv.columns="HBASE_ROW_KEY,info:name,order:no,order:date（列族：列名）" customer（表名） /input/hbase/hbase_import_data.csv（数据的hdfs路径）

2、在xshell执行hbase的jar程序，需要配置：

在hadoop安装目录下找到hadoop-env.sh文件，
添加 : export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/opt/hbase-2.0.2/lib/*

执行的命令为:
hadoop jar hbase.jar com.ScanTable

Idea开发hbase前提

C:\windows\system32\drivers\etc\hosts

192.168.104.200 hadoop1

192.168.104.201 hadoop2

192.168.104.202 hadoop3

192.168.104.203 hadoop4

Pom.xml配置

<dependency>

  <groupId>org.apache.hbase</groupId>

  <artifactId>hbase-client</artifactId>

  <version>2.0.2</version>

</dependency>

<dependency>

  <groupId>org.apache.hbase</groupId>

  <artifactId>hbase-common</artifactId>

  <version>2.0.2</version>

</dependency>

=========================================================

hive与hbase集成

拷贝hbase相关的8个jar包到hive lib下

修改hive-site.xml配置文件
修改hive.zookeeper.quorum属性

	<property>

	    <name>hive.zookeeper.quorum</name>

	    <value>hadoop1,hadoop2,hadoop3</value>

	</property>

将8个本地jar的路径配置到hive.aux.jars.path属性中

 <property>

        <name>hive.aux.jars.path</name>

		<value>file:///opt/hive-2.3.2/lib/hbase-client-2.0.2.jar,file:///opt/hive-2.3.2/lib/hbase-common-2.0.2.jar,file:///opt/hive-2.3.2/lib/hbase-server-2.0.2.jar,file:///opt/hive-2.3.2/lib/hbase-common-2.0.2-tests.jar,file:///opt/hive-2.3.2/lib/hbase-protocol-2.0.2.jar,file:///opt/hive-2.3.2/lib/htrace-core4-4.2.0-incubating.jar,file:///opt/hive-2.3.2/lib/hive-hbase-handler-2.3.2.jar,file:///opt/hive-2.3.2/lib/zookeeper-3.4.10.jar

		</value>

</property>

修改hive-env.sh配置文件
添加 export HBASE_HOME=/opt/hbase-2.0.2

HBase集群安装及集成的更多相关文章

hbase单机环境的搭建和完全分布式Hbase集群安装配置
HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境. @hbase单机环境的搭建 ...
HBase集群安装部署
0x01 软件环境 OS: CentOS6.5 x64 java: jdk1.8.0_111 hadoop: hadoop-2.5.2 hbase: hbase-0.98.24 0x02 集群概况 I ...
Hbase集群安装Version1.1.5
Hbase集群安装,基于版本1.1.5, 使用hbase-1.1.5.tar.gz安装包. 1.安装说明使用外部Zookeeper集群而非Hbase自带zookeeper, 使用Hadoop文件系统 ...
hbase集群安装与部署
1.相关环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 hbase1.2.4 本篇文章仅涉及hbase集群的搭建,关于hadoop与zookeeper的相关部 ...
Hbase 集群安装（Hadoop 2.6.0 hbase0.99.2）
一:说明该安装是在hadoop集群安装后进行,详情可见上一篇博客虚拟机centos7系统下安装hadoop ha和yarn ha(详细) .其中涉及五台机器,两台master(机器名:master, ...
HBase学习之路（二）HBase集群安装
前提 1.HBase 依赖于 HDFS 做底层的数据存储 2.HBase 依赖于 MapReduce 做数据计算 3.HBase 依赖于 ZooKeeper 做服务协调 4.HBase源码是java编 ...
Apache HBase 集群安装文档
简介: Apache HBase 是一个分布式的.面向列的开源 NoSQL 数据库.具有高性能.高可靠性.可伸缩.面向列.分布式存储的特性. HBase 的数据文件最终落地在 HDFS 之上,所以在 ...
hbase集群安装和shell操作
1.上传hbase安装包 2.解压 3.配置hbase集群,要修改3个文件(首先zk集群已经安装好了) 注意:要把hadoop的hdfs-site.xml和core-site.xml 放到hbase/ ...
spark集群安装并集成到hadoop集群
前言最近在搞hadoop+spark+python,所以就搭建了一个本地的hadoop环境,基础环境搭建地址hadoop2.7.7 分布式集群安装与配置本篇博客主要说明,如果搭建spark集群并集 ...
1.Hbase集群安装配置(一主三从）
1.HBase安装配置,使用独立zookeeper,shell测试安装步骤:首先在Master(shizhan2)上安装:前提必须保证hadoop集群和zookeeper集群是可用的 1.上传:用 ...

随机推荐

Python 实时获取任务请求对应的Nginx日志
需求描述项目需求测试过程中,需要向Nginx服务器发送一些用例请求,然后查看对应的Nginx日志,判断是否存在特征内容,来判断任务是否执行成功.为了提升效率,需要将这一过程实现自动化. 实践环境 P ...
locust多进程实现分布式压测遇到的问题
多进程分布式的实现: locust分布式时,需借助命令locust 一个一个启动worker,在使用中有点繁琐, 下面借助于多进程,按既定worker数量,一键启动: from locust impo ...
如何在AS中实现mysql查询并输出在视图上
新建子线程启用mysql new Thread(){ @override public void run(){ //在这里进行数据库调用 } }.start(); handler简单使用方法 hand ...
RPC接口测试（六）RPC协议解析（重要！重要！重要！）
RPC协议解析 RPC(Remote Procedure Call Protocol)远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议.简言之,RPC使得程 ...
【ActiveJdbc】05
一.事务通常在 Java ORM 中有一个显式连接或管理器对象(JPA 中的 EntityManager,Hibernate 中的 SessionManager 等). ActiveJDBC 中没有 ...
人形机器人sim2real —— 致使现实环境与仿真环境下的差距的因素 —— sim2real
下图引自:https://b2b.baidu.com/q/aland?q=7B7474317C2E72330F621B0F7D6F09247E747E610623742B&id=qid599a ...
【节选转载】人形机器人Optimus擎天柱技术解析
参考原文: https://www.sohu.com/a/589454391_383324?scm=9010.8000.0.0.1265 可以利用动作捕捉"学习"人类动作,依靠视觉 ...
为什么阿波罗机器人（Apollo）是外观最帅的机器人？
资料: https://www.youtube.com/watch?v=3CdwPGC9nyk 答案很简单,那就是这个公司单独找了一个外观设计团队,单独设计的外观. 看来啥事情要想搞的好,那就得多花钱 ...
ubuntu：通过缺失的系统lib库文件查找所需要安装的package——根据lib文件查找所属的package包——命令：sudo apt-file search
参考: 使用apt-file,根据文件查找所需安装的软件包 ======================================= 使用 apt-file 命令可以通过lib文件名查找其所属的 ...
git No url found for submodule path 'xxxxx' in .gitmodules
删除之前的子模块记录 rm -rf git rm --cached 然后加进去 git submodule add

HBase集群安装及集成

HBase集群安装及集成的更多相关文章

随机推荐

热门专题