部署HBase系统（分布式部署）

1.简介

HBase系统主要依赖于zookeeper和hdfs系统，所以部署HBase需要先去部署zookeeper和hadoop

2.部署开始

　　IP或者HOSTNAME需要根据自身主机信息设定。

　　部署资源：

　　　　　　两个节点：xufeng-2（管理节点） xufeng-3（从节点）

xufeng-3

xufeng-2

zookeeper

namenode

SecondaryNameNode

master

datanode

regionserver

　　部署版本：

　　　　　　CDH5.4.2

　　1.设定主机hostname

　　　　　　#adduser hadoop //添加一个用户
　　　　　　#passwd hadoop //修改密码

　　2.设定主机hostame　　

vi /etc/sysconfig/network

　　3.设定hosts文件：

10.211.55.18 xufeng-

10.211.55.21 xufeng-

　　4.拷贝安装包,按照如下设定安装包路径

　　其中组件文件夹通过软连接到具体安装目录，配置文件独立于安装目录，这样便于后续版本的替换

　　安装包可以去官网：http://archive.cloudera.com/cdh5/cdh/5/下载。

　　5.安装jdk，如下版本，hadoop已经全面放弃了1.6版本，所以请安装1.7及以上版本

jdk-7u79-linux-x64.rpm

　　6.设定无密码登录

hadoop用户下：

xufeng-3上执行：

ssh-keygen

cd ~/.ssh

scp id_rsa.pub xufeng-:/home/hadoop/.ssh/authorized_keys

xufeng-2上执行

ssh-keygen

cd ~/.ssh

scp id_rsa.pub xufeng-:/home/hadoop/.ssh/authorized_keys

增加：

    启动的时候需要ssh到自身，所以也需要将自身的公钥发布给自己：

    在各个节点上执行：

     cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

　　7.设定环境变量,通过环境变量的设定，各个服务可以找到对应的安装路径和配置文件路径　　

[hadoop@xufeng- hbase-config]$ vi ~/.bash_profile 

#hadoop

export HADOOP_HOME=/opt/hadoop/hadoop

export HADOOP_CONF_DIR=/opt/hadoop/hadoop-config

export HADOOP_LOG_DIR=/opt/hadoop/hadoop/xufeng

#hbase

export HBASE_HOME=/opt/hadoop/hbase

export HBASE_CONF_DIR=/opt/hadoop/hbase-config

#zookeeper

export ZOOKEEPER_HOME=/opt/hadoop/zookeeper

export ZOOCFGDIR=/opt/hadoop/zookeeper-config

#spark

export SPARK_HOME=/opt/hadoop/spark

export SPARK_CONF_DIR=/opt/hadoop/spark-config

PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$ZOOKEEPER_HOME/bin:SPARK_HOME/bin

export PATH

　　配置文件和包分割开来，便于后续方便的替换包（版本）。

　　8.【单节点】设定zookeeper，启动zookeeper

　　a.将zookeeper安装包内的conf文件夹下的内容拷贝到zookeeper-config目录下，并生成zoo.cfg文件　　

[hadoop@xufeng- bin]$ cd /opt/hadoop/zookeeper-config/

[hadoop@xufeng- zookeeper-config]$ ll

总用量

-rwxr-x---.  hadoop hadoop   6月   : configuration.xsl

-rwxr-x---.  hadoop hadoop  6月   : log4j.properties

-rw-rw-r--.  hadoop hadoop    6月   : zoo.cfg

-rw-rw-r--.  hadoop hadoop  6月   : zookeeper.out

-rwxr-x---.  hadoop hadoop   6月   : zoo_sample.cfg

　　zoo.cfg内容

[hadoop@xufeng- zookeeper-config]$ vi zoo.cfg 

tickTime=

dataDir=/opt/hadoop/hadoop_data/zookeeper

clientPort=

~

　　b.启动zookeeper

zkServer.sh start

　　检查线程

[hadoop@xufeng- zookeeper-config]$ jps

 QuorumPeerMain

 Jps

　　9.设定hadoop，启动hadoop

　　需要去主从节点上设定如下几个文件，这些文件都放在了/opt/hadoop/hadoop-config下，通过环境变量的指定进程能够读取到。

　　其中如果无特殊需要hadoop-env.sh和log4j文件只从安装包中拷贝不修改。

core-site.xml

hdfs-site.xml

hadoop-env.sh

log4j.properties

slaves

　　core-site.xml内容：

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://xufeng-3:9000</value>

        <description>NameNode URI</description>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>file:///opt/hadoop/hadoop_data/hadoop/hdfs/temp</value>

        <description>Abase for other temporary directories.</description>

    </property>

</configuration>

　　hdfs-site.xml内容：dfs.replication设定为1，因为我们只有一个datanode

<configuration>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:///opt/hadoop/hadoop_data/hdfs/namenode</value>

        <description>NameNode directory for namespace and transaction logs storage.</description>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:///opt/hadoop/hadoop_data/hdfs/datanode</value>

        <description>DataNode directory</description>

    </property>

    <property>

        <name>dfs.replication</name>

        <value></value>

    </property>

    <property>

        <name>dfs.permissions</name>

        <value>false</value>

    </property>

    <property>

        <name>dfs.datanode.use.datanode.hostname</name>

        <value>false</value>

    </property>

    <property>

        <name>dfs.namenode.datanode.registration.ip-hostname-check</name>

        <value>false</value>

    </property>

    <property>

         <name>dfs.namenode.http-address</name>

         <value>xufeng-:</value>

         <description>Your NameNode hostname for http access.</description>

    </property>

    <property>

         <name>dfs.namenode.secondary.http-address</name>

         <value>xufeng-:</value>

         <description>Your Secondary NameNode hostname for http access.</description>

    </property>

</configuration>

　　slaves内容： 只在xufeng-2这台机器上启动datanode

xufeng-

　　启动hdfs

start-dfs.sh

注意：

    听说centOS6有一个bug：

    需要关闭防火墙才能联通端口：

  service iptables stop

  chkconfig iptables off

　　进入页面：hdfs安装完成：　

10，设定HBase，启动HBase

　　的地水电费

　　将配置文件从安装目录中拷贝到/opt/hadoop/hbase-config,主要有如下文件：

　　其中hdfs-site.xml为软连接到hadoop的配置文件，因为HBase是作为hdfs的客户端角色。

　　hbase-env.sh内容（修改点）：不要让HBase使用集成的zookeeper，而是使用我们在xufeng-3上启动的zookeeper服务　

# Tell HBase whether it should manage it's own instance of Zookeeper or not.

export HBASE_MANAGES_ZK=false

　　hbase-site.xml内容：

<configuration>

<property>

  <name>hbase.cluster.distributed</name>

  <value>true</value>

</property>

<property>

  <name>hbase.rootdir</name>

  <value>hdfs://xufeng-3:9000/hbase</value>

</property>

<property>

  <name>hbase.zookeeper.quorum</name>

  <value>xufeng-:</value>

</property>

</configuration>

　　regionservers内容：只在xufeng-2这个从节点上启动regionserver服务

xufeng-

　　在xufeng-3节点上启动HBase：

start-hbase.sh

　　进入页面：HBase安装完成：

部署HBase系统（分布式部署）的更多相关文章

【Hadoop 分布式部署一：分布式部署准备虚拟机】
一.将IP配置为静态按照下面的操作将IP配置为静态IP 这个静态的IP地址是你自己设置的,只要符合虚拟机的IP段就可以.最后点击 Apply 需要root密码将网络断开 (在网络图标左键 ...
【Hadoop 分布式部署五：分布式部署之分发、基本测试及监控】
1.对 hadoop 进行格式化到 /opt/app/hadoop-2.5.0 目录下执行命令: bin/hdfs namenode -format 执行的效果图如下 ( 下图成功 ...
技术分享 | 在GreatDB分布式部署模式中使用Chaos Mesh做混沌测试
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 1. 需求背景与万里安全数据库软件GreatDB分布式部署模式介绍 1.1 需求背景混沌测试是检测分布式系统不确定性.建 ...
Hadoop及Zookeeper+HBase完全分布式集群部署
Hadoop及HBase集群部署一. 集群环境系统版本虚拟机:内存 16G CPU 双核心系统: CentOS-7 64位系统下载地址: http://124.202.164.6/files ...
BI系统的分布式部署原理和技术实现
1.什么是分布式关于"分布式系统"的定义,我们先看下书中是怎么说的.<分布式系统原理和范型>一书中是这样定义分布式系统的:"分布式系统是若干独立计算机的集合 ...
HBase独立集群部署
HBase是分布式.面向列式存储的开源数据库,来源于Google的论文BigTable,HBase运行于Hadoop平台之上,不同于一般的关系数据库,是一个适合非结构化数据存储的分布式数据库安装Hb ...
Hadoop生态圈-flume日志收集工具完全分布式部署
Hadoop生态圈-flume日志收集工具完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 目前为止,Hadoop的一个主流应用就是对于大规模web日志的分析和处理 ...
Hadoop1 Centos伪分布式部署
前言: 毕业两年了,之前的工作一直没有接触过大数据的东西,对hadoop等比较陌生,所以最近开始学习了.对于我这样第一次学的人,过程还是充满了很多疑惑和不解的,不过我采取的策略是还是先让环 ...
项目分布式部署那些事（1）：ONS消息队列、基于Redis的Session共享，开源共享
因业务发展需要现在的系统不足以支撑现在的用户量,于是我们在一周之前着手项目的性能优化与分布式部署的相关动作. 概况现在的系统是基于RabbitHub(一套开源的开发时框架)和Rabbit.WeiXi ...

随机推荐

python-输出颜色显示
显示颜色格式:\033[显示方式;字体色;背景色m...主题内容hello world...\033[0m \033 从这里开始标颜色................................. ...
BZOJ1090：[SCOI2003]字符串折叠——题解
http://www.lydsy.com/JudgeOnline/problem.php?id=1090 Description 折叠的定义如下: 1. 一个字符串可以看成它自身的折叠.记作S=S 2 ...
实验五 TCP传输及加解密
北京电子科技学院(BESTI) 实验报告课程:Java程序设计班级:1353 姓名:陈巧然 ...
shell中的数值运算
By francis_hao Oct 2,2017 本文摘录自bash的man手册. 算数运算相关的形式形式含义 ((expression)) expression按照下面描述的算术 ...
HDU3949 XOR (线性基)
HDU3949 XOR Problem Description XOR is a kind of bit operator, we define that as follow: for two bin ...
HDU2444 ：The Accomodation of Students(二分图染色+二分图匹配)
The Accomodation of Students Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K ( ...
TCP的连接（三次握手）和释放（四次挥手）
1 http都设置哪些header? http协议规定:一个完整的客户端发送给服务端的HTTP请求包括: (1)请求行:包括了请求方法.请求资源路径.HTTP协议版本,eg:GET/Server/im ...
牛客326B 背单词
传送门:https://ac.nowcoder.com/acm/contest/326/B 题意:给你一个n,你需有找有多少个长度从1~n 的单词,满足最长连续元音少于A个并且最长连续辅音长度少于B. ...
一图看懂深度学习框架对比----Caffe Torch Theano TensorFlow
Caffe Torch Theano TensorFlow Language C++, Python Lua Python Python Pretrained Yes ++ Yes ++ Yes ...
oracle重新编译失效对像
重新编译失效对像可执行utlrp.sql文件: SQL> @?/rdbms/admin/utlrp.sql TIMESTAMP --------------------------------- ...

部署HBase系统（分布式部署）

部署HBase系统（分布式部署）的更多相关文章

随机推荐

热门专题