Hadoop的安装有三种执行模式：

单机模式（Local (Standalone) Mode）：Hadoop的默认模式，0配置。Hadoop执行在一个Java进程中。使用本地文件系统。不使用HDFS，一般用于开发调试MapReduce程序的应用逻辑。
伪分布式模式（Pseudo-Distributed Mode）：需简单配置，相当于仅仅有一个节点的集群，Hadoop的全部守护进程执行在同一台机器上。该模式在单机模式之上添加了代码调试功能，同意你检查内存使用情况，HDFS输入输出。以及其它的守护进程交互。
全然分布式模式（Fully-Distributed Mode）：依据须要进行配置。多节点，一般用于生产环境。可觉得是由伪分布式模式的一个节点变为多个节点。

准备工作

总结一下就是：

Linux系统环境
安装JDK及其环境变量、ssh及ssh的免password登录
Hadoop安装包
环境变量的配置

环境搭建

改动core-site.xml

改动$HADOOP_HOME/etc/hadoop/core-site.xml文件。在默认情况下，这个文件为空。没有不论什么配置。这里须要指定NameNode的ip和port（默认port是8020）。

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://192.168.1.134:9000</value>

    </property>

</configuration>

192.168.1.134是我的本机地址。能够写localhost或127.0.0.1。可是假设须要Eclipse远程调用Hadoop的时候，须要些详细的ip地址。否则调不通。

改动hdfs-site.xml

HDFS是分布式文件系统。为了安全性考虑，会将上传至HDFS的文件的每一个分块复制到N个节点上，即复制N次（这里的N成为复制因子）。这里将复制因子改为1。

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>

启动最小Hadoop伪分布式模式

经过上面的最小配置后，Hadoop已经能够启动伪分布式模式了。

格式化文件系统

第一次执行Hadoop的时候须要格式化其文件系统：

$ bin/hdfs namenode -format

假设成功，会打印：

。。。

14/10/14 19:09:05 INFO common.Storage: Storage directory /tmp/hadoop-lxh/dfs/name has been successfully formatted.

。

。。

启动NameNode守护进程和DataNode守护进程

直接通过Hadoop提供的脚本start-dfs.sh就可以：

$ sbin/start-dfs.sh

启动日志保存在$HADOOPLOGDIR文件夹中（默认是$HADOOP_HOME/logs）。

查看启动的进程

能够通过jps查看已经启动的进程：

31536 SecondaryNameNode

31381 DataNode

31254 NameNode

31643 Jps

说明DataNode、NameNode、SecondaryNameNode已经启动成功。

查看NameNode的web接口

通过默认的NameNode的web接口http://localhost:50070/，能够查看NameNode收集的信息。相当于关于Hadoop提供的一个信息查询系统。

Hello World

运行官网提供的验证程序。

$ hdfs dfs -mkdir /input

$ hdfs dfs -put $HADOOP_HOME/etc/hadoop/* /input

$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar grep /input /output 'dfs[a-z.]+'

$ hdfs dfs -cat /output/*

最后一条命令是显示最后的运行结果：

6   dfs.audit.logger

4   dfs.class

3   dfs.server.namenode.

2   dfs.period

2   dfs.audit.log.maxfilesize

2   dfs.audit.log.maxbackupindex

1   dfsmetrics.log

1   dfsadmin

1   dfs.servers

1   dfs.replication

1   dfs.file

停止进程

伪分布式模式中的第一个Hello World运行成功后，能够关闭进程了。

$ stop-dfs.sh

配置YARN

通过配置一些參数，并启动ResourceManager守护进程和NodeManager守护进程，能够在伪分布式模式中，在YARN上执行MapReduce任务。

上面的最小配置不变。

改动mapred-site.xml

在默认的Hadoop安装包中，没有mapred-site.xml文件，能够复制mapred-site.xml.template，并改动。指定在YARN中执行MapReduce任务：

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

改动yarn-site.xml

指明须要向MapReduce应用提供的Shuffle服务。

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

执行

能够通过start-yarn.sh启动ResourceManager守护进程和NodeManager守护进程，通过stop-yarn.sh停止。

补充配置

Hadoop默认将HDFS文件系统写在/tmp/hadoop-中。由于系统重新启动会清理/tmp文件夹。所以须要保证重新启动系统不丢失数据，须要改动默认数据保存位置。

core-site.xml

<property>

    <name>hadoop.tmp.dir</name>

    <value>file:/home/lxh/hadoop/tmp/hadoop</value>

</property>

hdfs-site.xml

<property>

    <name>dfs.namenode.name.dir</name>

    <value>file:/home/lxh/hadoop/hdfs/name</value>

</property>

<property>

    <name>dfs.datanode.data.dir</name>

    <value>file:/home/lxh/hadoop/hdfs/data</value>

</property>

Hadoop伪分布式模式部署的更多相关文章

初学者值得拥有【Hadoop伪分布式模式安装部署】
目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 2.修 ...
Hadoop伪分布式模式搭建
title: Hadoop伪分布式模式搭建 Quitters never win and winners never quit. 运行环境: Ubuntu18.10-server版镜像:ubuntu- ...
Hadoop伪分布式模式安装
一.Hadoop介绍 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上:而且 ...
在Hadoop伪分布式模式下安装Hive(derby,mysql)
我的Hadoop版本是1.2.0,mysql版本是5.6.12. 先介绍一下嵌入式derby模式: 1.下载/解压在hive官网上选择要下载的版本,我选择的版本是hive-0.10.0. 下载好解压 ...
在Hadoop伪分布式模式下安装Hbase
安装环境:Hadoop 1.2.0, Java 1.7.0_21 1.下载/解压在hbase官网上选择自己要下的hbase版本,我选择的是hbase-0.94.8. 下载后解压到/usr/local ...
VMware workstation 下Hadoop伪分布式模式安装
详细过程: 1.VMware安装: 2.centos 6 安装 3.jdk下载安装配置 4.Hadoop 安装配置 1.VMware Workstation 安装: https://www.vmwar ...
Hadoop伪分布式模式
搭建在单一服务器基于官方文档 http://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster ...
Hadoop完全分布式模式安装部署
在Linux上搭建Hadoop系列:1.Hadoop环境搭建流程图2.搭建Hadoop单机模式3.搭建Hadoop伪分布式模式4.搭建Hadoop完全分布式模式注:此教程皆是以范例讲述的,当然你可以 ...
Hadoop伪分布模式配置部署
.实验环境说明注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍本实验环境采用带桌面的 ...

随机推荐

mfc添加气球式提示栏
// TOOLTIPWND.H 添加气球式提示栏 #if !defined(AFX_TOOLTIPWND_H__2C52D3E4_2F5B_11D2_8FC9_000000000000__IN ...
block 解析 - 局部变量
局部变量 block内使用局部变量,一般都是截获变量(只读),截获离block初始化最近的一次的值. 引用官方文档: Stack (non-static) variables local to the ...
C#中静态方法的运用和字符串的常用方法（seventh day)
又来到了今天的总结时间,由于昨天在云和学院学的知识没有弄懂,今天老师又专门给我们非常详细地讲了一遍,在这里非常谢谢老师.O(∩_∩)O 话不多说,下面就开始为大家总结一下静态方法的运用和字符串的常用方 ...
ARM异常---一个Uart中断的触发处理过程：
首先给出一些定义: //2440addr.inc INTOFFSET EQU 0x4a000014 ;Interruot request source offset //option.inc _ISR ...
linux安装LNMP的资源
wget http://nginx.org/download/nginx-0.7.69.tar.gz wget http://museum.php.net/php5/php-5.2.10.tar.gz ...
geoserver图层属性查询及查询结果转换为arcgis js api能使用的格式
一个项目使用了ArcGIS JS API开发GIS展示层,但GIS服务使用了Geoserver,这时加载Geoserver数据和查询数据就和之前完全不一样了,以下介绍下我使用ArcGIS JS API ...
graph isomorphism 开源算法库VFlib, Nauty
VFlib 开源算法库网站:http://www.cs.sunysb.edu/~algorith/implement/vflib/implement.shtml Nauty 开源算法库网站:http: ...
顺为资本CEO许达来:为什么说中国创业者很幸福？(附PPT)
顺为资本创始合伙人许达来编者按:许达来,顺为资本创始合伙人及CEO,代表性投资项目包括小米科技.丁香园.一起作业.加一联创.金山软件及兴达国际等. 本文为许达来在新浪创业举办的新创课活动上的内容分享 ...
[WPF疑难] 继承自定义窗口
原文 [WPF疑难] 继承自定义窗口 [WPF疑难] 继承自定义窗口周银辉项目中有不少的弹出窗口,按照美工的设计其外边框(包括最大化,最小化,关闭等按钮)自然不同于Window自身的,但每个弹出框 ...
Test class should have exactly one public zero-argument constructor
java.lang.Exception: Test class should have exactly one public zero-argument constructor at org.juni ...

Hadoop伪分布式模式部署