hadoop伪分布安装

解压

将安装包hadoop-2.2.0.tar.gz存放到/home/haozhulin/install/目录下，并解压

#将hadoop解压到/home/haozhulin/install路径下，定位目录到/home/haozhulin/install

tar –zxvf hadoop-2.2.0.tar.gz –C /home/haozhulin/install/

或者先让其有执行权限，然后直接./就可以解压

chmod
+x hadoop-2.2.0.tar.gz

./hadoop-2.2.0.tar.gz

修改解压后的目录中的文件夹etc/hadoop下的xml配置文件（如果文件不存在，则自己创建），后面开始修改配置文件6个：

在/home/haozhulin/install/hadoop-2.2.0/etc/hadoop/下的

hadoop-env.sh

core-site.xml

hdfs-site.xml

mapred-site.xml

yarn-site.xml

slaves
修改hadoop-env.sh

配置hadoop的jdk版本环境

cd /home/haozhulin/install/hadoop-2.2.0/etc/hadoop/

vim hadoop-env.sh

hadoop-env.sh为hadoop环境变量，依赖JDK，进行如下修改

#第27行

export JAVA_HOME=/home/haozhulin/install/java/jdk1.7.0_65
修改core-site.xml

在其<configuration></ configuration >中插入：



<property>

    <name>fs.default.name</name>

    

    <value>hdfs://whaozl001:9000</value>

</property>



<property>

    <name>hadoop.tmp.dir</name>

    <value>/home/haozhulin/install/hadoop-2.2.0/tmp</value>

</property>

上面写的whaozl001是主机名，也可以更改为地址入10.30.30.1，端口号9000也可以是其他的。需要注意的是whaozl001是在/etc/hosts/中设置的host，如果未设置，需要更换为localhost，最好设置，见1.2.7。

/home/haozhulin/install/hadoop-2.2.0/tmp为手动创建的haozhulin文件夹下的tmp目录下。
修改hdfs-site.xml

在其<configuration></ configuration >中插入：



<property>

    <name>dfs.replication</name>

    <value>1</value>

</property>

由于这里是伪分布，只有一台机器，只保存一份。

问题：当采用虚拟机搭建hadoop环境时，每次虚拟机重启后，hadoop无法启动成功？

解决方案：在hdfs-site.xml中增加以下两个配置项：



<property>

    <name>dfs.namenode.name.dir</name>

    <value>/home/haozhulin/install/hadoop-2.2.0/dfs/name</value>

</property>



<property>

    <name> dfs.datanode.data.dir </name>

    <value>/home/haozhulin/install/hadoop-2.2.0/dfs/data</value>

</property>

其中，各个目录一定要是非/tmp下的目录，dfs.namenode.name.dir属性可以配置多个目录，如/data1/dfs/name,/data2/dfs/name, /data3/dfs/name,….。各个目录存储的文件结构和内容都完全一样，相当于备份，这样做的好处是当其中一个目录损坏了，也不会影响到 Hadoop的元数据，特别是当其中一个目录是NFS（网络文件系统Network File System，NFS）之上，即使你这台机器损坏了，元数据也得到保存。
修改mapred-site.xml

在里面没有mapred-site.xml文件，但是提供了mapred-site.xml.template模板文件，将其重命名为mapred-site.xml文件，然后进行配置(后续不再重述)。

#cp命令也可以，mv为重命名命令

mv mapred-site.xml.template mapred-site.xml

vim mapred-site.xml

再在其<configuration></ configuration >中插入：



<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

mr为mapReduce，将mapReduce配置到yarn上运行
修改yarn-site.xml

在其<configuration></ configuration >中插入：



<property>

    <name>yarn.resourcemanager.hostname</name>

    <value>whaozl001</value>

</property>



<property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

</property>
修改slaves

#定位到/home/haozhulin/install/hadoop-2.2.0/etc/hadoop/slaves文件

vim etc/hadoop/slaves

#由于是单机伪分布，所以DataNode就只有localhost

#不需要修改，也可以改为127.0.0.1，都是指本机
将hadoop添加到环境变量

将hadoop添加到环境变量之后，可直接在命令窗口中使用hadoop命令(替换了其对应hadoop所在的路径)。

#指定到环境变量文件

vim /etc/profile

做如下修改：

#java environment

export JAVA_HOME=/home/haozhulin/install/java/jdk1.7.0_09

export HADOOP_HOME=/home/haozhulin/install/hadoop-2.2.0

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后刷新环境变量配置

source /etc/profile

【注意】最好是安装JDK同时，把HADOOP_HOME也配置好，后续方便(各DataNode机就不用麻烦)。
格式化namenode

这里所有配置当前路径应该是/home/haozhulin/install/hadoop-2.2.0/bin下

这里是对HDFS的namenode进行格式化。

#hadoop namenode –format 该命令过时了，但是依然可用

#进入hadoop位置/home/haozhulin/install/hadoop-2.2.0/bin/hadoop

which hadoop

#hdfs位置#/home/haozhulin/install/hadoop-2.2.0/bin/hdfs

which hdfs

之前配置core-site.xml时配置了一个tmp目录(非临时文件目录)

#新命令格式化namenode，产生tmp目录

hdfs namenode -format

【注意】如果没有配置hadoop环境变量，则格式化须使用：

#该命令过时

bin/hadoop namenode –format

#采用如下命令(同上)

bin/hdfs namenode -format
启动hadoop

这里可以一次用./sbin/start-all.sh启动所有，但是一般是先启动HDFS，然后启动yan(因为启动all会多次要求输入root密码)，而且start-all.sh命令已经过时。

#先启动HDFS

sbin/start-dfs.sh

#再启动yarn

sbin/start-yarn.sh

单独启动HDFS：

#跳转到hadoop-2.2.0目录下

sbin/hadoop-daemon.sh start namenode

sbin/hadoop-daemon.sh start datanode

单独启动yarn:

sbin/yarn-daemon.sh start nodemanager

sbin/yarn-daemon.sh start resourcemanager

验证hadoop启动成功

使用jps命令验证

jps

27408 NameNode

28218 Jps

27643 SecondaryNameNode

28066 NodeManager

27803 ResourceManager

27512 DataNode

jps为Java命令(which jps)

http://10.30.30.1:50070 (HDFS管理界面)

http://10.30.30.1:8088 (MapReduce管理界面)

表 2.1 hadoop各进程关系

进程	关系	含义
ResourceManager	yarn的老大	负责资源调度分配给 mapreduce/spark/storm
NodeManager	yarn的小弟	负责干活
NameNode	hdfs的老大	负责接收用户请求，数据映射关系
DataNode	hdfs的小弟	负责存储数据
SecondaryNameNode	NameNode的助理	不是NameNode的热备协助NameNode

NameNode一般是多个，一般配置一个主一个备。

hdfs测试(下载和上传)

#将/root/jdk-7u9-linux-i586.gz文件上传到hdfs/下并重命名为jdk

hadoop fs –put /root/jdk-7u9-linux-i586.gz hdfs://whaozl001:9000/jdk

然后通过http://10.30.30.1:50070(HDFS管理界面)里面的点击Browse the filesystem NameNode logs查看，也可以在里面下载。

可以将hadoop的系统理解为一个网盘。

#命令方式下载jdk并重命名为jdk1.7

hadoop fs –get hdfs://whaozl001:9000/jdk /home/jdk1.7

#解压这个文件

tar –zxvf jdk1.7
测试MapReduce和YARN

/home/haozhulin/install/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar下就是多个mapreduce的例子，里面有一个wordcount例子

#查看后面还需要跟哪些参数,wordcount需要一个输入一个输出

hadoop jar hadoop-mapreduce-expamples-2.2.0.jar

#弄一个words文件，里面有很多单词，将其上传到hdfs

hadoop fs –put /words hdfs://whaozl001:9000/words

#显示hdfs下的所有文件

hadoop fs –ls hdfs://whaozl001:9000

#测试examples中的wordcount例子

hadoop jar hadoop-mapreduce-expamples-2.2.0.jar wordcount hdfs://whaozl001:9000/words hdfs://whaozl001:9000/wcount

#查看结果

hadoop fs –ls hdfs://whaozl001:9000
检验错误

错误都保存在/home/haozhulin/install/hadoop-2.2.0/logs目录下

cd /home/haozhulin/install/hadoop-2.2.0/

ls

cd logs

hadoop伪分布安装的更多相关文章

Hadoop伪分布安装详解(五)
目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...
Hadoop伪分布安装详解(三)
目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...
转载 hadoop 伪分布安装
一. 概要经过几天的调试,终于在Linux Cent OS 5.5下成功搭建Hadoop测试环境.本次测试在一台服务器上进行伪分布式搭建.Hadoop 伪分布式模式是在单机上模拟 Ha ...
Hadoop伪分布安装详解(二)
目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...
Hadoop伪分布安装配置
安装环境: 系统:Ubuntu 14.10 64bit hadoop:2.5.1 jdk:1.8.0_11 安装步骤: 一.安装JDK 安装 jdk,并且配置环境以及设置成默认 sudo gedi ...
Hadoop伪分布安装详解(四)
目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...
Hadoop伪分布安装详解(一)
注:以下截图针对Ubuntu操作系统,对Centos步骤类似.请读者选择不同镜像即可. 第一部分:VMware WorkStation10 安装 1.安装好VMware10虚拟机软件并下载好Ubunt ...
linux配置Hadoop伪分布安装模式
1)关闭禁用防火墙: /etc/init.d/iptables status 会得到一系列信息,说明防火墙开着. /etc/rc.d/init.d/iptables stop 关闭防火墙 2)禁用SE ...
Hadoop学习记录（1）|伪分布安装
本文转载自向着梦想奋斗博客 Hadoop是什么? 适合大数据的分布式存储于计算平台不适用小规模数据作者:Doug Cutting 受Google三篇论文的启发 Hadoop核心项目 HDFS(Ha ...

随机推荐

HTML5 PC、Mobile调用摄像头（navigator.getUserMedia）
废话少说,先贴上代码 html: <div id="main" class="masthead"> <div id="face_sc ...
20160322 javaweb 学习笔记--response验证码实现
package com.dzq.servlet; import java.awt.Color; import java.awt.Font; import java.awt.Graphics2D; im ...
thinkphp之wampserver安装
1.如何修改www目录打开httpd.conf(wamp\bin\apache\Apache2.4.4\conf): 把DocumentRoot "c:/wamp/www" 修改 ...
OC 知识点回顾
/* 字符串: NSString 不可变字符串字符串对象的内容不能修改,字符串的指针可以改变 NSMutableString 可变字符串可以修改字符串对象的内容,继承自NSString , ...
sql server经典sql
1. sql server构造oracle rownum列 select * from ( select row_number() over(order by t.修改时间 desc) rownum, ...
redis基本数据类型【1】-String类型
1.赋值与取值 set key value get key 2.设置自增 #自增1 incr num #指定增长跨度 incrby num 10 设置自减 #自增1 decr num #指定增长跨度 ...
cinder
source /root/openrc 显示云硬盘: cinder list 这只是查看了admin租户下的,要查看所有租户下的云硬盘: cinder list --all-tenant 后台手动强行 ...
bzoj4330：JSOI2012 爱之项链
题目大意:一串项链由n个戒指组成,对于每个戒指,一共有M个点,R种颜色,且旋转后相同的戒指是相同的,然后一串项链又由N个戒指组成,同时要满足相邻的两个戒指不能相同,这串项链上某个位置插入了一个特殊的东 ...
九度OJ 1371 最小的K个数 -- 堆排序
题目地址:http://ac.jobdu.com/problem.php?pid=1371 题目描述: 输入n个整数,找出其中最小的K个数.例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4 ...
Android Activity 生命周期详解
学习android开发这么久对于activity的生命周期还没有仔细思考过,所以,我大致的把这些东西整理一下,希望通过这使自己理解的更透彻点吧! 首先看一下Activity生命周期图和它的的四个阶段 ...

hadoop伪分布安装

解压

修改hadoop-env.sh

修改core-site.xml

修改hdfs-site.xml

修改mapred-site.xml

修改yarn-site.xml

修改slaves

将hadoop添加到环境变量

格式化namenode

启动hadoop

验证hadoop启动成功

hdfs测试(下载和上传)

测试MapReduce和YARN

检验错误

hadoop伪分布安装的更多相关文章

随机推荐

热门专题