Hadoop安装部署基本步骤：

1、安装jdk，配置环境变量。

jdk可以去网上自行下载，环境变量如下：

编辑 vim /etc/profile 文件，添加如下内容：

export JAVA_HOME=/opt/java_environment/jdk1.7.0_80（填写自己的jdk安装路径）
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

输入命令，source /etc/profile 使配置生效

分别输入命令，java 、 javac 、 java -version，查看jdk环境变量是否配置成功

2、linux环境下，至少需要3台机子，一台作为master，2台（以上）作为slave。

　　这里我以3台机器为例，linux用的是CentOS 6.5 x64为机器。

master 192.168.172.71
slave1 192.168.172.72
slave2 192.168.172.73

3、配置所有机器的hostname和hosts。

（1）更改hostname，可以编辑 vim /etc/sysconfig/network

　　　　　更改master的HOSTNAME，这里改为HOSTNAME=master

　　　　　其它slave为HOSTNAME=slave1、HOSTNAME=slave2 ，重启后生效。

　　　　　或者直接输： hostname 名字，更改成功，这种方式无需重启即可生效，

　　　　　但是重启系统后更改的名字会失效，仍是原来的名字

　　　（2）更改host，可以编辑 vim /etc/hosts，增加如下内容：

　　　　　　 192.168.172.71 master
　　　　192.168.172.72 slave1
　　　 192.168.172.73 slave2

　　　　hosts可以和hostname不一致，这里为了好记就写一致了。

4、配置SSH所有机器之间免密码登录

　　（1）CentOS默认没有启动ssh无密登录,编辑 vim /etc/ssh/sshd_config，

　　　　去掉以下两行注释，开启Authentication免登陆。

　　　　 #RSAAuthentication yes
　　 #PubkeyAuthentication yes

　　如果是root用户下进行操作，还要去掉 #PermitRootLogin yes注释，允许root用户登录。

　　（2）输入命令，ssh-keygen -t rsa，生成key，一直按回车，

　　　　就会在/root/.ssh生成：authorized_keys id_rsa.pub id_rsa 三个文件，

　　　　这里要说的是，为了各个机器之间的免登陆，在每一台机器上都要进行此操作。

　　（3）接下来，在master服务器，合并公钥到authorized_keys文件，

　　　　　进入/root/.ssh目录，输入以下命令

　　　 cat id_rsa.pub>> authorized_keys 把master公钥合并到authorized_keys 中

　　　　 ssh root@192.168.172.72 cat ~/.ssh/id_rsa.pub>> authorized_keys

　　　　 ssh root@192.168.172.73 cat ~/.ssh/id_rsa.pub>> authorized_keys

　　　　把slave1、slave2公钥合并到authorized_keys 中

完成之后输入命令，把authorized_keys远程copy到slave1和slave2之中

　　　　scp authorized_keys 192.168.172.72:/root/.ssh/

　　　 scp authorized_keys 192.168.172.73:/root/.ssh/

　　　　最好在每台机器上进行chmod 600 authorized_keys操作，

　　　　使当前用户具有 authorized_keys的读写权限。

　　　　拷贝完成后，在每台机器上进行 service sshd restart 操作，重新启动ssh服务。

　　　　之后在每台机器输入 ssh 192.168.172.xx，测试能否无需输入密码连接另外两台机器。

5、配置Hadoop环境变量，HADOOP_HOME、hadoop-env.sh、yarn-env.sh。

　　（1）配置HADOOP_HOME，编辑 vim /etc/profile 文件，添加如下内容：

　　　　　export HADOOP_HOME=/opt/hbase/hadoop-2.7.3 （Hadoop的安装路径）

　　　　　export PATH=$PATH:$HADOOP_HOME/sbin

　　　　　export PATH=$PATH:$HADOOP_HOME/bin　

　　　　（以下两行最好加上，若没有启动Hadoop、hbase时都会有没加载lib成功的警告）　　　　

　　　　　 export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
　　　　　export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"

　　（2）配置hadoop-env.sh、yarn-env.sh，在Hadoop安装目录下

　　　　编辑 vim etc/hadoop/hadoop-env.sh

　　　　　　加入export JAVA_HOME=/opt/java_environment/jdk1.7.0_80（jdk安装路径）

　　　　编辑 vim etc/hadoop/yarn-env.sh

　　　　　　加入export JAVA_HOME=/opt/java_environment/jdk1.7.0_80（jdk安装路径）

　　　　保存退出

6、配置基本相关xml，core-site.xml、hdfs-site.xml、mapred-site.xml、mapred-site.xml

　　（1）配置core-site.xml，在Hadoop安装目录下编辑 vim etc/hadoop/core-site.xml

<property>
　　　　　　　　<name>fs.defaultFS</name> 
　　　　　　　　<value>hdfs://mater:9000</value>
　　　　　　</property>
　　　　　　<property>
　　　　　　　　<name>hadoop.tmp.dir</name> 
　　　　　　　　<value>/opt/hbase/hadoop-2.7.3/temp</value>
　　　　　　</property>
　　　　</configuration>

　　（2）配置hdfs-site.xml，在Hadoop安装目录下编辑 vim etc/hadoop/hdfs-site.xml

<property> 
　　　　　　　　<name>dfs.namenode.name.dir</name>
　　　　　　　　<value>/opt/hbase/hadoop-2.7.3/dfs/name</value>

</property>
　　　　　　<property> 
　　　　　　　　<name>dfs.datanode.data.dir</name>
　　　　　　　　<value>/opt/hbase/hadoop-2.7.3/dfs/data</value>
　　　　　　　</property>
　　　　　　<property> 
　　　　　　　　<name>dfs.replication</name>
　　　　　　　　<value>2</value>
　　　　　　</property>

<property>
　　　　　　　　<name>dfs.namenode.secondary.http-address</name>
　　　　　　　　<value>master:9001</value>
　　　　　　</property>
　　　　　　<property> 
　　　　　　　　<name>dfs.webhdfs.enabled</name>
　　　　　　　　<value>true</value>
　　　　　　</property>
　　　　</configuration>

（3）配置mapred-site.xml，在Hadoop安装目录下编辑 vim etc/hadoop/mapred-site.xml

<property> 
　　　　　　<name>mapreduce.framework.name</name>
　　　　　　<value>yarn</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>mapreduce.jobhistory.address</name>
　　　　　　<value>master:10020</value>
　　　　</property>
　　　　<property>
　　　　　　<name>mapreduce.jobhistory.webapp.address</name>
　　　　　　<value>master:19888</value>
　　　　</property>
　　</configuration>

（4）配置yarn-site.xml，在Hadoop安装目录下编辑 vim etc/hadoop/yarn-site.xml

<property> 
　　　　　　<name>yarn.nodemanager.aux-services</name>
　　　　　　<value>mapreduce_shuffle</value>
　　　　</property>
　　　　<property>
　　　　　　<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
　　　　　　<value>org.apache.hadoop.mapred.ShuffleHandler</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>yarn.resourcemanager.address</name>
　　　　　　<value>master:8032</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>yarn.resourcemanager.scheduler.address</name>
　　　　　　<value>master:8030</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>yarn.resourcemanager.resource-tracker.address</name>
　　　　　　<value>master:8031</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>yarn.resourcemanager.admin.address</name>
　　　　　　<value>master:8033</value>
　　　　</property>
　　　　<property> 
　　　　　　<name>yarn.resourcemanager.webapp.address</name>
　　　　　　<value>master:8088</value>
　　　　</property>
　　</configuration>

7、配置slaves文件

　　在Hadoop安装目录下，编辑vim etc/hadoop/slaves，

　　去除默认的localhost，加入slave1、slave2，保存退出。

8、通过远程复制命令scp，将配置好的Hadoop复制到各个节点对应位置

　　scp -r /opt/hadoop-2.7.3 192.168.172.72:/opt/hadoop-2.7.3
　　scp -r /opt/hadoop-2.7.3 192.168.172.73:/opt/hadoop-2.7.3

9、Hadoop的启动与停止

　　（1）在Master服务器启动hadoop，从节点会自动启动，进入Hadoop目录下，

　　　　　　输入命令，bin/hdfs namenode -format进行hdfs格式化

　　　　　　输入命令，sbin/start-all.sh，进行启动

　　　　　　也可以分开启动，sbin/start-dfs.sh、sbin/start-yarn.sh

　　　　　　在master 上输入命令：jps，看到ResourceManager、

　　　　　　NameNode、SecondaryNameNode进程

　　　　　　在slave 上输入命令：jps，看到DataNode、NodeManager进程

　　　　　　出现这5个进程就表示Hadoop启动成功。

　　（2）接下来配置本地hosts，编辑 C:\Windows\System32\drivers\etc的hosts文件，加入

　　　　　　192.168.172.71 master

　　　　　　192.168.172.72 slave1

　　　　　　192.168.172.73 slave2

　　　　在浏览器中输入http://master:50070查看master状态，

　　　　输入http://192.168.172.72:8088查看集群状态

　　（3）停止hadoop，进入Hadoop目录下，输入命令：sbin/stop-all.sh，

　　　　即可停止master和slave的Hadoop进程

Hbase安装部署基本步骤：

　　1、在Hadoop配置的基础上，配置环境变量HBASE_HOME、hbase-env.sh

　　　　编辑 vim /etc/profile 加入

　　　　　 export HBASE_HOME=/opt/hbase-1.2.6

　　　　 export PATH=$HBASE_HOME/bin:$PATH

　　　　编辑vim /opt/hbase-1.2.6/conf/hbase-env.sh 加入

　　　　　 export JAVA_HOME=/opt/java_environment/jdk1.7.0_80（jdk安装路径）

　　　　去掉注释 # export HBASE_MANAGES_ZK=true，使用hbase自带zookeeper。

　　 2、配置hbase-site.xml文件　

<property>
　　　　　　　　<name>hbase.rootdir</name> 
　　　　　　　　<value>hdfs://master:9000/opt/hbase/hbase_db</value>

</property>
　　　　　　<property>
　　　　　　　　<name>hbase.cluster.distributed</name> 
　　　　　　　　<value>true</value>
　　　　　　</property>
　　　　　　<property>
　　　　　　　　<name>hbase.zookeeper.quorum</name> 
　　　　　　　　<value>master,slave1,slave2</value>
　　　　　　</property>

<property>
　　　　　　　　　　<name>hbase.zookeeper.property.dataDir</name>
　　　　　　　　　　<value>/opt/hbase/zookeeper</value>
　　　　　　　</property>

　　　　</configuration>

　　3、配置regionservers

　　　　编辑 vim /opt/hbase-1.2.6/conf/regionservers 去掉默认的localhost，
　　　加入slave1、slave2，保存退出　

　　　然后把在master上配置好的hbase，通过远程复制命令

　　　 scp -r /opt/hbase-1.2.6 192.168.172.72/73:/opt/hbase-1.2.6

　　　复制到slave1、slave2对应的位置

　　4、启动与停止Hbase

　　　　（1）在Hadoop已经启动成功的基础上，输入start-hbase.sh，过几秒钟便启动完成，

　　　　　　输入jps命令查看进程是否启动成功，若 master上出现HMaster、HQuormPeer，

　　　　　　slave上出现HRegionServer、HQuorumPeer，就是启动成功了。

　　　（2）输入hbase shell 命令进入hbase命令模式

　　　　　输入status命令可以看到如下内容，1个master，2 servers，3机器全部成功启动。

　　　　　 1 active master, 0 backup masters, 2 servers, 0 dead, 2.0000 average load

　　　　（3）接下来配置本地hosts，（前边配置过的无需再配置了）

　　　　　　编辑 C:\Windows\System32\drivers\etc的hosts文件，加入

　　　　　　　　192.168.172.71 master

　　　　　　　　192.168.172.72 slave1

　　　　　　　　192.168.172.73 slave2

　　　　　　在浏览器中输入http://master:16010就可以在界面上看到hbase的配置了

　　　　（4）当要停止hbase时输入stop-hbase.sh，过几秒后hbase就会被停止了。

Hadoop+Hbas完全分布式安装部署的更多相关文章

Hadoop基础-完全分布式模式部署yarn日志聚集功能
Hadoop基础-完全分布式模式部署yarn日志聚集功能作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 其实我们不用配置也可以在服务器后台通过命令行的形式查看相应的日志,但为了更方 ...
Hadoop开发第3期---Hadoop的伪分布式安装
一.准备工作 1. 远程连接工具的安装 PieTTY 是在PuTTY 基础上开发的,改进了Putty 的用户界面,提供了多语种支持.Putty 作为远程连接linux 的工具,支持SSH 和telne ...
Hbase-0.96.2全然分布式安装部署
Hbase-0.96.2全然分布式安装部署环境: Hadoop-2.2.0 Zookeeper-3.4.6 hbase-0.96.2 1.下载hbase-0.96.2-hadoop2-bin.tar ...
Apache Hadoop集群离线安装部署(三)——Hbase安装
Apache Hadoop集群离线安装部署(一)——Hadoop(HDFS.YARN.MR)安装:http://www.cnblogs.com/pojishou/p/6366542.html Apac ...
Ganglia监控Hadoop集群的安装部署[转]
Ganglia监控Hadoop集群的安装部署一. 安装环境 Ubuntu server 12.04 安装gmetad的机器:192.168.52.105 安装gmond的机器:192.168.52 ...
Apache Hadoop集群离线安装部署(二)——Spark-2.1.0 on Yarn安装
Apache Hadoop集群离线安装部署(一)——Hadoop(HDFS.YARN.MR)安装:http://www.cnblogs.com/pojishou/p/6366542.html Apac ...
Apache Hadoop集群离线安装部署(一)——Hadoop(HDFS、YARN、MR)安装
虽然我已经装了个Cloudera的CDH集群(教程详见:http://www.cnblogs.com/pojishou/p/6267616.html),但实在太吃内存了,而且给定的组件版本是不可选的, ...
Hadoop简介与分布式安装
Hadoop的基本概念和分布式安装: Hadoop 简介 Hadoop 是Apache Lucene创始人道格·卡丁(Doug Cutting)创建的,Lucene是一个应用广泛的文本搜索库,Hado ...
Hadoop2.7.3+Hbase-1.2.6+spark2.1.2完全分布式安装部署
https://www.cnblogs.com/lzxlfly/p/7221890.html 总的下载地址: http://mirror.bit.edu.cn/apache/ hadoop下 ...

随机推荐

oracle 数据库相关名词--图解
通过下图,我们可以更好的理解oracle的结构关系. 知识拓展: 知识点及常用的命令如下: 1)通常情况我们称的“数据库”,并不仅指物理的数据集合,他包含物理数据.数据库管理系统.也即物理数据.内存 ...
浅谈STM32L071硬件I2C挂死
STM32的IIC问题一直存在,在网上也被很多人吐槽,然而FAE告诉我,硬件IIC的问题在F1,F3,F4系列单片机存在,而在L0上已经解决了,然而这几天调试加密芯片和显示芯片,都是IIC芯片,却再一 ...
hdu1535 Invitation Cards 最短路
有一张图,若干人要从不同的点到同一个中间点,再返回,求总费用最小中间点到各个点最小费用是普通的最短路各个点到中间点最小费用其实就是将所有路径反向建边之后中间点到各个点的最小费用,同样用最短路就可以 ...
vue 2.0 vue.set的使用方法
这里我定义了一个列表数据,我将通过三个不同的按钮来控制列表数据. 首先在列表中动态新增一条数据: <!DOCTYPE html><html><head lang=&quo ...
C#获取当前路径的七种方法【转载】
//1.获取模块的完整路径. string path1 = System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName; // ...
我发起了一个 .Net Core 平台上的开源项目 ShadowDomain 用于热更新
大家好, 我发起了一个 .Net Core 平台上的开源项目 ShadowDomain 用于热更新 . 简单的说, 原理就是类似 Asp.net 那样让当前 WebApp 运行在一个 A ...
taro refs引用
创建 Refs Taro 支持使用字符串和函数两种方式创建 Ref: 使用字符串创建 ref 通过函数创建 ref(推荐) 你也可以通过传递一个函数创建 ref, 在函数中被引用的组件会作为函数的第一 ...
thinkphp5 列表页数据分页查询-带搜索条件
一.控制器部分 <?php namespace app\user\controller; use app\user\model\HelpCenterManual as HelpCenterMan ...
弱网测试—Network-Emulator-Toolkit工具
参考别人网址:http://blog.csdn.net/no1mwb/article/details/53638681 弱网测试,属于健壮性测试:怎么样去做弱网测试呢? 一.安装弱网测试工具-Netw ...
Zookeeper权限acl，acl的构成 scheme与id
一.ACl(accerss control lists)权限控制 1 针对节点可以设置相关读写权限,目的为了保障数据安全性 2.权限permissions可以指定不同的权限范围以及角色二.ACL命 ...

Hadoop+Hbas完全分布式安装部署

Hadoop安装部署基本步骤：

1、安装jdk，配置环境变量。

2、linux环境下，至少需要3台机子，一台作为master，2台（以上）作为slave。

3、配置所有机器的hostname和hosts。

4、配置SSH所有机器之间免密码登录

5、配置Hadoop环境变量，HADOOP_HOME、hadoop-env.sh、yarn-env.sh。

6、配置基本相关xml，core-site.xml、hdfs-site.xml、mapred-site.xml、mapred-site.xml

7、配置slaves文件

8、通过远程复制命令scp，将配置好的Hadoop复制到各个节点对应位置

9、Hadoop的启动与停止

Hbase安装部署基本步骤：

1、在Hadoop配置的基础上，配置环境变量HBASE_HOME、hbase-env.sh

2、配置hbase-site.xml文件

3、配置regionservers

4、启动与停止Hbase

Hadoop+Hbas完全分布式安装部署的更多相关文章

随机推荐

热门专题

　　1、在Hadoop配置的基础上，配置环境变量HBASE_HOME、hbase-env.sh

　　 2、配置hbase-site.xml文件　

　　3、配置regionservers

　　4、启动与停止Hbase