HBase学习笔记之HBase的安装和配置


我是为了调研和验证hbase的bulkload功能,才安装hbase,学习hbase的。为了快速的验证bulkload功能,我安装了一个节点的hadoop集群和一个节点的hbase。安装过程如下。

1、简介

2、安装环境准备

3、具体安装过程

1、简介

=========

hbase是hadoop生态系统中的一个软件,是基于hadoop的数据库软件。

2、安装环境准备

===============

hbase安装之前必须安装hadoop,所以在安装hbase之前必须先安装hadoop。

vm:vmware player 6.0.7

os:centos6.10

jdk:1.8.0_45

hadoop:apache hadoop-2.7.5.tar.gz

hbase: apache hbase-1.0.1.1-bin.tar.gz

2.0 安装环境准备

----------------------------

这里写一下centos安装之后的环境设置,主要包括:(1)修改主机名为master和hosts文件中的host-ip映射关系(ip master),(2)ssh免密登录,(3)jdk安装

这几步都很简单,就略了。

2.1 hadoop单节点安装过程

-------------------------------------

hadoop的安装过程略微复杂,这里简略的概述一下,详细过程,请参考参考资料1.

下载到的hadoop二进制包是hadoop-2.7.5.tar.gz。

(1)解压到/usr/local/bigdata下,bigdata是一个特意创建的目录,用来存放大数据相关软件的安装目录

tar -xzf hadoop-2.7.5.tar.gz -C /usr/local/bigdata/

然后配置一下环境变量/etc/profile:

#hadoop
export HADOOP_HOME=/usr/local/bigdata/hadoop/hadoop-2.7.5
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

之后source /etc/profile,让环境变量起效。

(2)修改hadoop的配置文件,配置文件位于hadoop安装目录下的etc/hadoop中,主要涉及的配置文件如

文件名称 格式       功能描述                
hadoopenv.sh     shell脚本   这个脚本是hadoop启动的时候执行的,用来为hadoop的执行准备执行环境,其中主要是一些环境变量的设置
core-site.xml   xml文档   是hadoop core的配置项,其中可以设置hdfs的uri地址,hadoop的tmp目录等
hdfs-site.xml   xml文档 是hdfs的主要配置文件,其中可以配置hdfs的name node存放元数据的目录,hdfs的data node存放数据的目录,hdfs存放的数据副本个数
yarn-site.xml xml文档 yarn的主要配置文件,yarn的  ResourceManager和NodeManager的配置项                                                              
mapred-site.xml xml文档   mapreduce的主要配置文件,其中可以配置mapreduce需要用的资源调度框架
slaves           plain text 其中记录了作为slave的机器的主机名或者ip地址 

(3)格式化

hdfs namenode -format

(4)启动hadoop

start-dfs.sh && start-yarn.sh

(5)验证启动是否成功

hdfs dfs -ls /

3、hbase安装

============

(1)下载、解压

-------------------------

tar -xzf hbase-1.0.1.1-bin.tar.gz  -C  /usr/local/bigdata/hbase/

然后配置一下环境变量/etc/profile:

#hbase
export HBASE_HOME=/usr/local/bigdata/hbase/hbase-1.0.1.1
export PATH=$PATH:$HBASE_HOME/bin

之后source /etc/profile,让环境变量起效。

(2)配置

---------------------

hbase-env.sh文件是为hbase准备运行环境的shell脚本,在其中修改两个配置项:

export JAVA_HOME=/usr/local/jdk1.8.0_45 #这个配置项设置jdk的安装位置

export HBASE_MANAGES_ZK=true   #这个配置项表示用hbase自己管理zookeeper,就是使用hbase自带的zookeeper运行hbase,因为hbase运行的时候需要zookeeper,一般hbase自己带了一个zookeeper,当然也可以独立安装一个zookeeper,这时候要把这个配置项的值设置为false

regionservers文件内容修改为安装的主机的名字:master

hbase-site.xml是hbase的主配置文件,将其内容修改为:

<configuration>
        <property>
                        <name>hbase.rootdir</name>
                        <value>hdfs://master:9000/hbase</value>               <description>hbase在hdfs上存储数据的目录</description>
        </property>
        <property>
                        <name>hbase.cluster.distributed</name>
                        <value>true</value>                  <description>表示hbase是分布式的,而不是standalone模式</description>        </property>        <!--下面是hbase的reginonserver进程的两个端口,特意设置这两个端口是有复杂的原因的,具体可以看参考资料2-->
        <property>
                        <name>hbase.regionserver.port</name>
                        <value>16040</value>
        </property>
        <property>
                        <name>hbase.regionserver.info.port</name>
                        <value>16041</value>
        </property>
</configuration>

(3)hbase启动和验证

---------------------------------

执行start-hbase.sh启动hbase

jps查看启动进程,看到红色的三个进程表示启动成功了:

[root@master conf]# jps
5537 HMaster
5474 HQuorumPeer
4677 SecondaryNameNode
4933 NodeManager
5670 HRegionServer
4489 DataNode
4379 NameNode
9275 Jps
4830 ResourceManager
[root@master conf]#

执行hbase shell,进入hbase的shell环境:

[root@master conf]# hbase shell
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/usr/local/bigdata/hbase/hbase-1.0.1.1/lib/slf4j-log4j12-1.7.7.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/usr/local/bigdata/hadoop/hadoop-2.7.5/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Type "exit<RETURN>" to leave the HBase Shell
Version 1.0.1.1, re1dbf4df30d214fca14908df71d038081577ea46, Sun May 17 12:34:26 PDT 2015

hbase(main):001:0>

这样就安装完成了。

参考资料:

0、https://www.cnblogs.com/oraclestudy/articles/5665780.html,这是hbase的介绍,直接看看的不明白,看个大概,等安装完成,试用了hbase之后,再回过头来看,就能看明白了,然后再根据这篇文章的理解,做些实验。

1、《hadoop海量数据处理 技术详解与项目实战 第2版》第二章,hadoop的安装,hbase的安装都详细参考这个资料。

2、https://blog.csdn.net/h12kjgj/article/details/78669244,这篇文章说了hbase的端口冲突问题,也说了为什么端口冲突,很好的解决了hmaster和hregionserver的端口冲突问题

3、http://www.cnblogs.com/nexiyi/p/hbase_intro_94.html,这篇也是详细说明hbase的,配合0,可以详细学习hbase

HBase学习笔记之HBase的安装和配置的更多相关文章

  1. HBase学习笔记之HBase原理和Shell使用

    HBase学习指南之HBase原理和Shell使用 参考资料: 1.https://www.cnblogs.com/nexiyi/p/hbase_shell.html,hbase shell

  2. [原创]HBase学习笔记(1)-安装和部署

    HBase安装和部署 使用的HBase版本是1.2.4 1.安装步骤(默认hdfs已安装好) # 下载并解压安装包 cd tools/ tar -zxf hbase-1.2.4-bin.tar.gz ...

  3. Git学习笔记(1)——安装,配置,创建库,文件添加到库

    初次接触git,为了记忆深刻,把学习的简单流程记录下来. 本文记录了Git在Ubuntu上的安装,配置,以及创建版本库和往库中添加文件的过程. 1.Git的安装:(Ubuntu-Linux非常友好的安 ...

  4. HBase学习笔记2 - HBase shell常用命令

    转载请标注原链接:http://www.cnblogs.com/xczyd/p/6639397.html 扫表的时候限定行数 scan } 即为扫表的时候,限定只输出五条数据 ============ ...

  5. Appium学习笔记(一)--安装与配置

    移动自动化测试常用工具有两个:Appium和Robotium.正好最近自己开始负责客户端的工作,初来乍到需要熟悉下环境,正好学习新的东西. 移动自动化相对web来说,原理与操作过程是一样的,通过自动化 ...

  6. ElasticSearch学习笔记-01 简介、安装、配置与核心概念

    一.简介 ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进 ...

  7. Vue 新手学习笔记:vue-element-admin 之安装,配置及入门开发

    所属专栏: Vue 开发学习进步 说实话都是逼出来的,对于前端没干过ES6都不会的人,vue视频也就看了基础的一些但没办法,接下来做微服务架构,前端就用 vue,这块你负责....说多了都是泪,脚手架 ...

  8. Zabbix学习笔记一:基本安装与配置

    1.下载安装 http://120.52.73.43/tenet.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%20Stable/3.0.1/za ...

  9. Nagios学习笔记一:基本安装和配置

    ()解决安装Nagios的依赖关系: Nagios基本组件的运行依赖于httpd.gcc和gd.可以通过以下命令来检查nagios所依赖的rpm包是否已经完全安装: # yum -y install ...

随机推荐

  1. SQL Server 2019 新版本

    2019 年 11 月 4 日,微软在美国奥兰多举办的 Ignite 大会上发布了关系型数据库 SQL Server 的新版本.与之前版本相比,新版本的 SQL Server 2019 具备以下重要功 ...

  2. SQL Server sp_monitor使用

    SQL Server提供了sp_monitor存储过程可以方便我们查看SQL Server性能统计信息,包括CPU/Network/IO,通过这些信息可以对自己的数据库性能状况有一个大致的了解. 下面 ...

  3. delphi xe6 JSON 测试

    System.JSON   ISuperJSOn   mORMETJSON   QJSON  测试 我在测试时发现系统自带的JSON  占用内存大一但多了就会出现内存泄漏的问题 我用的Flst< ...

  4. 《JAVA高并发编程详解》-并发编程有三个至关重要的特性:原子性,有序性,可见性

  5. Mysql表字段命令alter add

    alter add命令用来增加表的字段. alter add命令格式:alter table 表名 add字段 类型 其他; 例如,在表MyClass中添加了一个字段passtest,类型为int(4 ...

  6. EgretWing链接微信开发工具调试问题

    EgretWing链接微信开发工具调试问题 EgretWing 编译器支持持三种调试模式,Node.js .Chrome .EgretWing 扩展开发. 开发过程中会遇到工具配置错误. 这就需要在E ...

  7. .net Dapper 实践系列(4) ---数据查询(Layui+Ajax+Dapper+MySQL)

    写在前面 上一小节,总结了数据显示时,会出现的日期问题.以及如何处理格式化日期.这个小节,主要总结的是使用Dapper 中的QueryMultiple方法依次显示查询多表的数据. 实践步骤 1.在Bo ...

  8. Docker/Dockerfile debug调试技巧

    『重用』容器名 但我们在编写/调试Dockerfile的时候我们经常会重复之前的command,比如这种docker run --name jstorm-zookeeper zookeeper:3.4 ...

  9. 玩转dockerfile

    镜像的缓存特性 Docker 会缓存已有镜像的镜像层,构建新镜像时,如果某镜像层已经存在,就直接使用,无需重新创建. 举例说明.在前面的 Dockerfile 中添加一点新内容,往镜像中复制一个文件: ...

  10. ashx 接受 post json 请求

    HttpContext.Current.Response.ContentType = "application/json";            HttpContext.Curr ...