Hadoop Yarn（一）—— 单机伪分布式环境安装

HamaWhite(QQ:530422429)原创作品，转载请注明出处：http://write.blog.csdn.net/postedit/40556267。

本文是依据Hadoop官网安装教程写的Hadoop YARN在单机伪分布式环境下的安装报告。仅供參考。

1. 安装环境例如以下：

系统：Ubuntu14.04

Hadoop版本号：hadoop-2.5.0

Java版本号：openjdk-1.7.0_55

2. 下载Hadoop-2.5.0，http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.5.0/hadoop-2.5.0.tar.gz

本文的$HADOOP_HOME为：/home/baisong/hadoop-2.5.0（username为baisong）。

在 ~/.bashrc文件里加入环境变量，例如以下：

export HADOOP_HOME=/home/baisong/hadoop-2.5.0

   然后编译，命令例如以下：

  $ source ~/.bashrc

3. 安装JDK，并设置JAVA_HOME环境变量。在/etc/profile文件最后加入例如以下内容

  export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386 //依据自己Java安装文件夹而定

export PATH=$JAVA_HOME/bin:$PATH

输入下面命令使配置生效

  $ source /etc/profile

4. 配置SSH。

首先生成秘钥，命令例如以下。然后一路回车确认，不须要不论什么输入。

$ ssh-keygen -t rsa 然后把公钥写入authorized_keys文件里。命令例如以下：

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

最后。输入下述命令。按提示输入 yes 就可以。

$ ssh localhost

5. 改动Hadoop配置文件，进入${HADOOP_HOME}/etc/hadoop/文件夹。

1）环境变量设置，hadoop-env.sh中加入Java安装文件夹，例如以下：

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386

2）改动core-site.xml，加入例如以下内容。

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/baisong/hadooptmp</value>

</property>

注：hadoop.tmp.dir项可选（上述设置需手动创建hadooptmp目录）。

3）改动hdfs-site.xml，加入下面内容“。

<property>

<name>dfs.repliacation</name>

<value>1</value>

</property>

4）将mapred-site.xml.template重命名为mapred-site.xml，并加入例如以下内容。

$ mv mapred-site.xml.template mapred-site.xml //重命名

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

5）改动yarn-site.xml，加入下面内容。

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

6. 格式化HDFS，命令例如以下：

bin/hdfs namenode -format 凝视：bin/hadoop namenode -format命令已过时

格式化成功会在/home/baisong/hadooptmp创建dfs目录。

7.启动HDFS，命令例如以下：

$ sbin/start-dfs.sh

遇到例如以下错误：

14/10/29 16:49:01 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

Starting namenodes on [OpenJDK Server VM warning: You have loaded library /home/baisong/hadoop-2.5.0/lib/native/libhadoop.so.1.0.0

 which might have disabled stack guard. The VM will try to fix the stack guard now.

It's highly recommended that you fix the library with 'execstack -c <libfile>', or link it with '-z noexecstack'.

localhost]

sed: -e expression #1, char 6: unknown option to `s'

VM: ssh: Could not resolve hostname vm: Name or service not known

library: ssh: Could not resolve hostname library: Name or service not known

have: ssh: Could not resolve hostname have: Name or service not known

which: ssh: Could not resolve hostname which: Name or service not known

might: ssh: Could not resolve hostname might: Name or service not known

warning:: ssh: Could not resolve hostname warning:: Name or service not known

loaded: ssh: Could not resolve hostname loaded: Name or service not known

have: ssh: Could not resolve hostname have: Name or service not known

Server: ssh: Could not resolve hostname server: Name or service not known

分析原因知。没有设置 HADOOP_COMMON_LIB_NATIVE_DIR和HADOOP_OPTS环境变量。在 ~/.bashrc文件里加入例如以下内容并编译。

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

  $ source ~/.bashrc

又一次启动HDFS，输出例如以下。表示启动成功。



  能够用过Web界面来查看NameNode执行状况。URL为 http://localhost:50070

  停止HDFS的命令为：

  $ sbin/stop-dfs.sh

8. 启动YARN，命令例如以下：

$ sbin/start-yarn.sh

   能够用过Web界面来查看NameNode执行状况，URL为 http://localhost:8088

   停止HDFS的命令为：

$ sbin/stop-yarn.sh

   上述HDFS和YARN启动完毕后，可通过jps命令查看是否启动成功。

9. 执行測试程序。

1）測试计算PI，命令例如以下：

       $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar
pi 20 10

   2）測试 grep，首先须要上传输入文件到HDFS上。命令例如以下：

      $
bin/hdfs dfs -put etc/hadoop input

       执行grep程序，命令例如以下：

       $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'

       执行结果输出例如以下：

10. 加入环境变量，方便使用start-dfs.sh、start-yarn.sh等命令（可选）。

在 ~/.bashrc文件里加入环境变量，例如以下：

     export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

     然后编译，命令例如以下：

$ source ~/.bashrc

     下图是 ~/.bashrc文件里加入的变量，以便參考。

Hadoop Yarn（一）—— 单机伪分布式环境安装的更多相关文章

Hadoop 3.1.3伪分布式环境安装Hive 3.1.2的异常总结
背景:hadoop版本为3.1.3, 且以伪分布式形式安装,hive版本为3.1.2,hive为hadoop的一个客户端. 1. 安装简要步骤 (1) 官网下载apache-hive-3.1.2-bi ...
Hadoop：Hadoop单机伪分布式的安装和配置
http://blog.csdn.net/pipisorry/article/details/51623195 因为lz的linux系统已经安装好了很多开发环境,可能下面的步骤有遗漏. 之前是在doc ...
Hadoop 在windows 上伪分布式的安装过程
第一部分:Hadoop 在windows 上伪分布式的安装过程安装JDK 1.下载JDK http://www.oracle.com/technetwork/java/javaee/d ...
Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验
Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...
hadoop 2.7.3伪分布式环境运行官方wordcount
hadoop 2.7.3伪分布式模式运行wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次以伪分布式模式来运行w ...
Hadoop Single Node Setup（hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3）
Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...
Hadoop伪分布式环境安装
一.环境准备阿里云ECS(Centos7).已预装JDK8 Hadoop安装包 hadoop-2.7.7.tar.gz 二. 安装步骤 1.确认JDK环境的安装位置命令 echo $JAVA_HO ...
hadoop 2.6.0 伪分布式部署安装遇到的问题
之前读到了一篇关于配置安装hadoop的博文(地址:http://www.powerxing.com/install-hadoop/)能正确安装和运行,但是在网页进行Jobtracker监控时,输入l ...
转载：Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...

随机推荐

对比hive和mysql 复杂逻辑流处理
1.Mysql中可用存储过程和函数来实现复杂逻辑处理,两者的对比如下:存储过程作为可执行文件,编译一次放在数据库中,函数又返回值.可设定使用权限. 存储过程中可使用游标,声明变量.用call调用. ...
Angular——配置模块与运行模块
配置模块通过config方法实现对模块的配置,AngularJS中的服务大部分都对应一个“provider”,用来执行与对应服务相同的功能或对其进行配置.比如$log.$http.$location ...
DIV水平垂直居中CSS
/*实现一.原理:要让div等块级元素水平和垂直居中,必需知道该div等块级元素的宽度和高度,然后设置位置为绝对位置,距离页面窗口左边框和上边框的距离设置为50%,这个50%就是指页面窗口的宽度和高度 ...
Verilog之event
1 Explicit event The value changes on nets and variable can be used as events to trigger the executi ...
CAD保存文件为各种格式
<p class="mtext"> 主要用到函数说明:</p><p style="line-height: 0.6;"> & ...
【原】Python学习
1.常用模块介绍 #python -m SimpleHTTPServer 执行上面的命令就会在服务器当前目录下启动一个文件下载服务器,默认打开8000端口.这个时候,你只需要将IP和端口告诉客户端,即 ...
react 中样式私有
解决的问题,两个组件之间有相同的class名,造成其中一个无法按预期的显示. import React, { Component } from 'react' import styles from ...
idea安装及使用
使用:https://blog.csdn.net/qq_42303709/article/details/81983208 安装教程:https://blog.csdn.net/yl171272518 ...
洛谷——P1850 换教室
P1850 换教室有 2n 节课程安排在 nn 个时间段上.在第 i个时间段上,两节内容相同的课程同时在不同的地点进行,其中,牛牛预先被安排在教室 $c_i$ 上课,而另一节课程在教室 $d_i$ ...
mysql5.7报Access denied for xxx@localhost 的解决
使用root用户登录mysql数据库若如下报错 ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using passwor ...

Hadoop Yarn（一）—— 单机伪分布式环境安装

Hadoop Yarn（一）—— 单机伪分布式环境安装的更多相关文章

随机推荐

热门专题