Hadoop Yarn(一)—— 单机伪分布式环境安装
HamaWhite(QQ:530422429)原创作品,转载请注明出处:http://write.blog.csdn.net/postedit/40556267。
本文是依据Hadoop官网安装教程写的Hadoop YARN在单机伪分布式环境下的安装报告。仅供參考。
1. 安装环境例如以下:
系统:Ubuntu14.04
Hadoop版本号:hadoop-2.5.0
Java版本号:openjdk-1.7.0_55
2. 下载Hadoop-2.5.0,http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.5.0/hadoop-2.5.0.tar.gz
本文的$HADOOP_HOME为:/home/baisong/hadoop-2.5.0(username为baisong)。
在 ~/.bashrc文件里加入环境变量,例如以下:
export HADOOP_HOME=/home/baisong/hadoop-2.5.0
然后编译,命令例如以下:
$ source ~/.bashrc
3. 安装JDK,并设置JAVA_HOME环境变量。在/etc/profile文件最后加入例如以下内容
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386 //依据自己Java安装文件夹而定
export PATH=$JAVA_HOME/bin:$PATH
输入下面命令使配置生效
$ source /etc/profile
4. 配置SSH。
首先生成秘钥,命令例如以下。然后一路回车确认,不须要不论什么输入。
$ ssh-keygen -t rsa 然后把公钥写入authorized_keys文件里。命令例如以下:
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
最后。输入下述命令。按提示输入 yes 就可以。
$ ssh localhost
5. 改动Hadoop配置文件,进入${HADOOP_HOME}/etc/hadoop/文件夹。
1)环境变量设置,hadoop-env.sh中加入Java安装文件夹,例如以下:
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386
2)改动core-site.xml,加入例如以下内容。
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/baisong/hadooptmp</value>
</property>
注:hadoop.tmp.dir项可选(上述设置需手动创建hadooptmp目录)。
3)改动hdfs-site.xml,加入下面内容“。
<property>
<name>dfs.repliacation</name>
<value>1</value>
</property>
4)将mapred-site.xml.template重命名为mapred-site.xml,并加入例如以下内容。
$ mv mapred-site.xml.template mapred-site.xml //重命名
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
5)改动yarn-site.xml,加入下面内容。
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
6. 格式化HDFS,命令例如以下:
bin/hdfs namenode -format 凝视:bin/hadoop namenode -format命令已过时
格式化成功会在/home/baisong/hadooptmp创建dfs目录。
7.启动HDFS,命令例如以下:
$ sbin/start-dfs.sh
遇到例如以下错误:
14/10/29 16:49:01 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Starting namenodes on [OpenJDK Server VM warning: You have loaded library /home/baisong/hadoop-2.5.0/lib/native/libhadoop.so.1.0.0
which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c <libfile>', or link it with '-z noexecstack'.
localhost]
sed: -e expression #1, char 6: unknown option to `s'
VM: ssh: Could not resolve hostname vm: Name or service not known
library: ssh: Could not resolve hostname library: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
which: ssh: Could not resolve hostname which: Name or service not known
might: ssh: Could not resolve hostname might: Name or service not known
warning:: ssh: Could not resolve hostname warning:: Name or service not known
loaded: ssh: Could not resolve hostname loaded: Name or service not known
have: ssh: Could not resolve hostname have: Name or service not known
Server: ssh: Could not resolve hostname server: Name or service not known
分析原因知。没有设置 HADOOP_COMMON_LIB_NATIVE_DIR和HADOOP_OPTS环境变量。在 ~/.bashrc文件里加入例如以下内容并编译。
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
$ source ~/.bashrc
又一次启动HDFS,输出例如以下。表示启动成功。
能够用过Web界面来查看NameNode执行状况。URL为 http://localhost:50070
停止HDFS的命令为:
$ sbin/stop-dfs.sh
8. 启动YARN,命令例如以下:
$ sbin/start-yarn.sh
能够用过Web界面来查看NameNode执行状况,URL为 http://localhost:8088
停止HDFS的命令为:
$ sbin/stop-yarn.sh
上述HDFS和YARN启动完毕后,可通过jps命令查看是否启动成功。
9. 执行測试程序。
1)測试计算PI,命令例如以下:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar
pi 20 10
2)測试 grep,首先须要上传输入文件到HDFS上。命令例如以下:
$
bin/hdfs dfs -put etc/hadoop input
执行grep程序,命令例如以下:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'
执行结果输出例如以下:
10. 加入环境变量,方便使用start-dfs.sh、start-yarn.sh等命令(可选)。
在 ~/.bashrc文件里加入环境变量,例如以下:
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
然后编译,命令例如以下:
$ source ~/.bashrc
下图是 ~/.bashrc文件里加入的变量,以便參考。
Hadoop Yarn(一)—— 单机伪分布式环境安装的更多相关文章
- Hadoop 3.1.3伪分布式环境安装Hive 3.1.2的异常总结
背景:hadoop版本为3.1.3, 且以伪分布式形式安装,hive版本为3.1.2,hive为hadoop的一个客户端. 1. 安装简要步骤 (1) 官网下载apache-hive-3.1.2-bi ...
- Hadoop:Hadoop单机伪分布式的安装和配置
http://blog.csdn.net/pipisorry/article/details/51623195 因为lz的linux系统已经安装好了很多开发环境,可能下面的步骤有遗漏. 之前是在doc ...
- Hadoop 在windows 上伪分布式的安装过程
第一部分:Hadoop 在windows 上伪分布式的安装过程 安装JDK 1.下载JDK http://www.oracle.com/technetwork/java/javaee/d ...
- Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验
Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...
- hadoop 2.7.3伪分布式环境运行官方wordcount
hadoop 2.7.3伪分布式模式运行wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次以伪分布式模式来运行w ...
- Hadoop Single Node Setup(hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3)
Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...
- Hadoop伪分布式环境安装
一.环境准备 阿里云ECS(Centos7).已预装JDK8 Hadoop安装包 hadoop-2.7.7.tar.gz 二. 安装步骤 1.确认JDK环境的安装位置 命令 echo $JAVA_HO ...
- hadoop 2.6.0 伪分布式部署安装遇到的问题
之前读到了一篇关于配置安装hadoop的博文(地址:http://www.powerxing.com/install-hadoop/)能正确安装和运行,但是在网页进行Jobtracker监控时,输入l ...
- 转载:Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...
随机推荐
- url-safe base64 && base64
1: 为什么需要base64? ASCII码一共规定了128个字符的编码,这128个符号,范围在[0,127]之间. 其中,[0,31],及127, 33个属于不可打印的控制字符. 在电子邮件传输信息 ...
- linux cp复制文件 直接覆盖
命令: \cp -rf aaaa/* bbbb 复制aaa下的文件到bbb目录
- Java排序算法全
目录 Java排序算法代码 零. 排序基类 一. 选择排序 二. 插入排序 三. 希尔排序 四. 归并排序 1. 自顶向下 2. 自底向上 五. 快速排序 1. 基本版 2. 双路切分版 3. 三路切 ...
- DBDA
<?php class DBDA{ public $host = "localhost"; //服务器地址 public $uid = "root"; / ...
- 小程序接口越过域名和https限制方法
都知道小程序上线接口需要域名,还需要https,就算是体验版的都是需要的,这样就筛选掉一大批开发者,像我这样只有学生轻量级服务器的学生要开发自己的小程序就很为难,但今天确惊奇的在小程序社区里面找到了用 ...
- MySql-了解存储引擎
怎么应对不同版本 在不同的 mysql 版本中,很多特性和语法有可能是不一样的,我们怎么样才能知道当前版本的语法是什么样呢?最好的办法是学会使用 mysql 的帮助. A.按照层次看帮助 例如:mys ...
- 微信小程序,获取点击元素的索引值index
1.需求说明 点击 “加号图片” 上传图片,需要知道点击的是第几个图片,动态的修改src数组,这里图片用的 wx:for 循环出来的 2.遇到问题 按照官方最新文档循环的方式,索引值是以 wx:fo ...
- 55.fielddata内存控制以及circuit breaker断路器
课程大纲 fielddata加载 fielddata内存限制 监控fielddata内存使用 circuit breaker 一.fielddata加载 fielddata加载到内存的过程是lazy加 ...
- BZOJ 4415 洛谷 3988 [Shoi2013]发牌
[题解] 权值线段树.查询当前牌堆顶的牌并且删掉就好了. #include<cstdio> #include<algorithm> #define N 3000010 #def ...
- nginx+keepalived+consul 实现高可用集群
继 负载均衡 之 nginx+consul+consul template,我这次将使用2台虚拟机,来做一个简单的双机负载均衡试验. 试验目标: 1. 当参加负载均衡的子节点服务,有任何其中一个或多个 ...