hadoop安装

在Apache Hadoop主页的下载页面https://hadoop.apache.org/releases.html选择版本进行下载：

下载下来的是压缩包：

将压缩包使用Xftp上传hadoop-1的/usr目录下：

执行命令：

  1 # tar -zxvf hadoop-2.7.7.tar.gz

解压完成后会在/usr目录下生成hadoop-2.7.7目录：

然后设置环境变量：

  1 # vim /etc/profile

在profile文件末尾添加：

  1 export HADOOP_HOME=/usr/hadoop-2.7.7

  2 export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

保存文件，然后执行：

  1 # source /etc/profile

此时即可直接使用hadoop命令：

启动hadoop有三种安装模式：本地模式、伪分布式模式、分布式模式。

本地模式

本地模式只需要修改/usr/hadoop-2.7.7/etc/hadoop/hadoop-env.sh文件，设置JAVA_HOME即可。

在hadoop-1上面进行本地模式配置，在终端使用vim打开该文件：

  1 # vim hadoop-2.7.7/etc/hadoop/hadoop-env.sh

找到export JAVA_HOME=${JAVA_HOME}一行，将该行注释掉，然后添加一行：

  1 export JAVA_HOME=/usr/java/jdk1.8.0_201-amd64

本地模式即配置完成。

由于本地模式没有HDFS，所以只能使用本地数据测试MapReduce程序。

在/home目录下创建temp目录，在temp目录中创建一个test.txt文件：

  1 # mkdir /home/temp

  2 # vim /home/temp/test.txt

在test.txt文件中写入如下测试内容：

  1 this is a example

  2 hello world hello bob hello everyone

执行命令进入MapReduce示例程序目录：

  1 # cd /usr/hadoop-2.7.7/share/hadoop/mapreduce

查看目录下的内容，执行命令：

  1 # ls -l

其中hadoop-mapreduce-examples-2.7.7.jar就是要来用测试的jar包，测试执行如下：

  1 # hadoop jar hadoop-mapreduce-examples-2.7.7.jar wordcount /home/temp/test.txt /home/temp/mcl

测试结果会生成在/home/temp/mcl目录下，执行命令查看结果：

  1 # cat /home/temp/mcl/part-r-00000

可以看到每个单词的统计结果数据。

伪分布式模式

伪分布式模式是在单机上，模拟一个分布式的环境，具备Hadoop的所有功能。

配置文件路径：/usr/hadoop-2.7.7/etc/hadoop/

首先配置的文件是hadoop-env.sh，与本地模式一样，配置好JAVA_HOME参数即可。

然后配置的两个文件是hdfs-site.xml和core-site.xml，这两个文件作用是配置HDFS的一些属性。

在hdfs-site.xml文件中配置（数据冗余级别设置为1）：

在core-site.xml文件中配置（namenode的地址和HDFS数据保存的目录，默认是Linux的tmp目录）：

其中tmp目录要手动创建：

  1 # mkdir /usr/hadoop-2.7.7/tmp

接下来配置的两个文件是mapred-site.xml和yarn-site.xml，这两个文件的作用是配置mapreduce使用yarn容器和yarn的一些属性。

现在目录中没有mapred-site.xml文件，但是有一个mapred-site.xml.template文件，所以在/usr/hadoop-2.7.7/etc/hadoop路径下执行命令：

  1 # cp mapred-site.xml.template mapred-site.xml

然后在拷贝的mapred-site.xml文件中添加配置（ResourceManager的地址）：

在yarn-site.xml文件中配置（NodeManager运行MR任务的方式）：

最后对namenode进行格式化，执行命令：

  1 # hdfs namenode -format

只要看到信息中有一句关键：

common.Storage: Storage directory /usr/hadoop-2.7.7/tmp/dfs/name has been successfully formatted.

则格式化成功：

启动hadoop，执行/usr/hadoop-2.7.7/sbin目录下的启动脚本：

  1 # start-all.sh

完成后信息无报错：

执行jps命令查看进程如下：

则启动完成。

打开浏览器，输入http://192.168.44.128:50070，即可打开hdfs的web页面：

点击Datanodes可以看到数据节点为hadoop-1：

测试wordcount验证是否成功：

创建hadoop的wordCountInput用来上传test.txt文件，执行命令：

  1 # hadoop fs -mkdir /wordCountInput

目录创建完成后，将/home/temp/test.txt文件上传该目录，执行命令：

  1 # hadoop fs -put /home/temp/test.txt /wordCountInput

查看文件是否上传，执行命令：

  1 # hadoop fs -ls /wordCountInput

然后使用hadoop-mapreduce-examples-2.7.7.jar测试执行如下：

  1 # hadoop jar /usr/hadoop-2.7.7/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /wordCountInput/test.txt /wordCountOutput

等待计算完成，查看wordCountOutput目录下的文件，执行命令：

  1 # hadoop fs -ls /wordCountOutput

可以看到计算结果文件已经生成：

查看结果数据，执行命令：

  1 # hadoop fs -cat /wordCountOutput/part-r-00000

test.txt文件中各个单词的统计数据如下：

停止进程执行命令：

  1 # stop-all.sh

等下stop完成，执行jps命令可以看到进程已经全部关闭：

完全分布式模式

是真正的分布式环境，具备生产条件。

完全分布式模式与伪分布式模式的区别就在于配置文件配置内容不同，namenode与datanode分别部署在不同的服务器上。

以下使用hadoop-1、hadoop-2和hadoop-3三台服务器搭建一个完全分布式集群，其中hadoop-1为namenode节点，其余两台为datanode节点。

在hadoop-1服务器上：

首先配置hadoop-env.sh文件，配置好JAVA_HOME参数。

然后配置hdfs-site.xml文件，将冗余级别改为3：

接下来core-site.xml文件，内容不需要修改：

接下来mapred-site.xml文件，内容不需要修改：

接下来yarn-site.xml 文件，内容不需要修改：

最后slaves文件中的localhost，改成hadoop-2和hadoop-3：

修改完成之后，将以上文件全部拷贝到hadoop-2和hadoop-3的相应目录下无需做其他修改。

hadoop重置

因为之前搭建伪分布式模式时，格式化过hadoop-1的namenode，所以此处需要进行重置。

首先要删除/usr/hadoop-2.7.7/logs目录中的所有文件

  1 # rm -r *

然后重新格式化namenode：

然后执行启动：

然后使用命令jps，查看三台服务器的进程如下：

hadoop-1：

hadoop-2：

hadoop-3：

打开浏览器，输入http://192.168.44.128:50070，即可打开hdfs的web页面：

点击Datanodes可以看到数据节点为hadoop-2和hadoop-3：

本地模式一般情况下不用，开发可以使用伪分布式模式或者资源充足情况下使用完全分布式模式。

文中的配置文件参数都是最简化的配置，实际情况应该按照需求进行配置。

hadoop的安装和配置的更多相关文章

hadoop的安装和配置（三）完全分布式模式
博主会用三篇文章为大家详细说明hadoop的三种模式: 本地模式伪分布模式完全分布模式完全分布式模式: 前面已经说了本地模式和伪分布模式,这两种在hadoop的应用中并不用于实际,因为几乎没人会 ...
hadoop的安装和配置（二）伪分布模式
博主会用三篇文章为大家详细的说明hadoop的三种模式: 本地模式伪分布模式完全分布模式伪分布式模式: 这篇为大家带来hadoop的伪分布模式: 从最简单的方面来说,伪分布模式就是在本地模式上修 ...
Ubuntu下伪分布式模式Hadoop的安装及配置
1.Hadoop运行模式Hadoop有三种运行模式,分别如下:单机(非分布式)模式伪分布式(用不同进程模仿分布式运行中的各类节点)模式完全分布式模式注:前两种可以在单机运行,最后一种用于真实的集群环境 ...
Hadoop(2)-CentOS下的jdk和hadoop的安装与配置
准备工作下载jdk8和hadoop2.7.2 使用sftp的方式传到hadoop100上的/opt/software目录中配置环境如果安装虚拟机时选择了open java,请先卸载 rpm -q ...
Linux中Hadoop的安装与配置
一.准备 1,配通网络 ping www.baidu.com 之前安装虚拟机时配过 2,关闭防火墙 systemctl stop firewalld systemctl disable firewal ...
ubuntu在虚拟机下的安装 ~~~ Hadoop的安装及配置 ~~~ Hdfs中eclipse的安装
前言 Hadoop是基于Java语言开发的,具有很好跨平台的特性.Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统.而Linux系统则 ...
Hadoop单机版安装，配置，运行
Hadoop是最近非常流行的东东啦,但是乍一看都觉得是集群的东东,其实在单机版上安装Hadoop也是可以的,并且安装好以后可以很方便的进行程序的调试,调试好程序以后再丢到集群中,放心的算吧,呵呵.. ...
hadoop的安装和配置（一）本地模式
博主会用三篇文章来为大家详细的说明hadoop的三种模式: 本地模式伪分布模式完全分布模式本地模式: 思路走向 |--------------------| | ①:配置Java环境 | | ...
Ubuntu16.04 下 hadoop的安装与配置（伪分布式环境）
一.准备 1.1创建hadoop用户 $ sudo useradd -m hadoop -s /bin/bash #创建hadoop用户,并使用/bin/bash作为shell $ sudo pass ...
Mac Hadoop的安装与配置
这里介绍Hadoop在mac下的安装与配置. 安装及配置Hadoop 首先安装Hadoop $ brew install Hadoop 配置ssh免密码登录用dsa密钥认证来生成一对公钥和私钥: $ ...

随机推荐

mysql数据库隔离级别及其原理、Spring的7种事物传播行为
一.事务的基本要素(ACID) 1.原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节.事务执行过程中出错,会回滚到事务开始前的状态,所有的操作就像没有 ...
cassandra cpp driver中bind list——用cass_statement_bind_collection函数
CassError insert_into_collections(CassSession* session, const char* key, const char* items[]) { Cass ...
RandomUtils
package com.cc.hkjc.util; import java.util.Random; public class RandomUtils { /** * 获取count个随 ...
codeforces 691F F. Couple Cover(组合计数)
题目链接: F. Couple Cover time limit per test 3 seconds memory limit per test 512 megabytes input standa ...
「网络流24题」「LuoguP4015」运输问题
Description W 公司有 m 个仓库和 n 个零售商店.第 i 个仓库有 ai 个单位的货物:第 j 个零售商店需要 bj 个单位的货物. 货物供需平衡,即 ∑ai=∑bj . 从第 i ...
Android开发中几种有用的的日历控件实现
我们大家都知道,在Android平台3.0中才新增了日历视图控件,可以显示网格状的日历内容,那么对于3.0以下的版本要使用日历控件只能借助第三方,目前用的最多的是CalendarView. 先简单介绍 ...
从mysql高可用架构看高可用架构设计
高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间. 假设系统一直能够提供服务,我们说系统的可用性是100%.如果 ...
composer下载tp5第三方扩展
(谨记:如果使用 composer 命令安装失败,请查看根目录下的 composer.json 文件是否正确,并查看下的扩展是否有多个版本,下载的版本是否符合当前框架的版本) 1.基础 compose ...
HDU6024：Building Shops（DP）
传送门题意在一条直线上有n个教室,现在要设置糖果店,使得最后成本最小,满足以下两个条件: 1.若该点为糖果店,费用为cost[i]; 2.若不是,则为loc[i]-最近的糖果店的loc 分析 dp ...
POJ 2392【多重背包】
题意: k个块,给出每个块的高度hi,数量ci,不能超过的高度: 求这些块可以组成的最大高度一个. 思路: 大致可看这个题是一个背包,背包的承重是高度. 对于每个物品,有他的价值是高度,还有限定的数量 ...

hadoop的安装和配置