hadoop2.4.1伪分布模式部署

（承接上一篇hadoop2.4.1-src的编译安装继续配置：http://www.cnblogs.com/wrencai/p/3897438.html）

感谢：http://blog.sina.com.cn/s/blog_5252f6ca0101kb3s.html

感谢：http://blog.csdn.net/coolwzjcool/article/details/32072157

感谢***：http://www.ituring.com.cn/article/63927#

完全分布式：http://www.cnblogs.com/scotoma/archive/2012/09/18/2689902.html

1.配置hadoop环境变量

在/etc/profile文件结尾增加hadoop安装目录的PATH路径

export HADOOP_PREFIX=/opt/hadoop-2.4.-src/hadoop-dist/target/hadoop-2.4.

export PATH=$PATH:$HADOOP_PREFIX/bin

2.修改该主机名为master:

a.编辑/etc/sysconfig/network文件修改hostname，执行hostname master立刻生效修改

vim /etc/sysconfig/network

hostname master

b.修改/etc/hosts文件，添加

127.0.0.1 master

注：此处修改主机名很重要，否则可能会导致后面启动时，无法启动datanode进程。后面配置文件的修改用到本机ip的地方，都用修改该过的主机名master代替，

3.配置hadoop相关配置文件

进入到hadoop安装目录此处为：/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1

对etc/hadoop中的文件进行配置（相关文件hadoop-env.sh 、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml）

a.配制core-site.xml

<configuration>

 <property>

  <name>fs.default.name</name>

  <value>hdfs://master:8010</value>

 </property>

 <property>

  <name>hadoop.tmp.dir</name>

  <value>/home/hadoop/hadoop-2.4.1/tmp/hadoop-${user.name}</value>

 </property>

</configuration>

注意红色字体hadoop是我为配置hadoop2.4.1设立的账户名称，是系统在home目录下自动创建的，可以根据需要更改。

b.配制hdfs-site.xml

<configuration>

   <property>

    <name>dfs.replication</name>

    <!--系统默认文件保存3份，因伪分布模式，故改为1份-->

    <value>1</value>

   </property>

   <property>

    <name>dfs.namenode.name.dir</name>

    <value>/home/hadoop/hadoop-2.4.0/dfs/name</value>

   </property>

   <property>

    <name>dfs.datanode.data.dir</name>

    <value>/home/hadoop/hadoop-2.4.0/dfs/data</value>

   </property>

  </configuration>

c.配制mapred-site.xml

<configuration>

<property>

 <name>mapred.job.tracker</name>

 <value>master:54311</value>

</property>

<property>

 <name>mapred.map.tasks</name>

 <value>10</value>

</property>

<property>

 <name>mapred.reduce.tasks</name>

 <value>2</value>

</property>

</configuration>

d.配置yarn-site.xml

<configuration>

  <!-- Site specific YARN configuration properties -->

   <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

   </property>

  </configuration>

f.修改slaves文件，修改后如下：

localhost

3.ssh免密码登陆设置：参考http://lhflinux.blog.51cto.com/1961662/526122

ssh链接是需要密码认证的，可以通过添加系统认证（即公钥-私钥）的修改，修改后系统间切换可以避免密码输入和ssh认证。

a. 修改文件：vi /etc/ssh/sshd_config

RSAAuthentication yes         开启RSA加密方式
   PubkeyAuthentication yes      开启公钥认证
   AuthorizedKeysFile .ssh/authorized_keys      公钥存放位置

PasswordAuthentication yes 使用密码登录

GSSAPIAuthentication no 防止登录慢，以及报错问题

ClientAliveInterval 300 300秒超时自动退出
ClientAliveCountMax 10 允许SSH远程连接的最大数

b.在root根目录下执行：

ssh-keygen -t rsa -P ''

回车，然后输入密码，完成后再执行：（本机作为伪集群的一个节点，也需要将认证写入authorized,不执行下一句可能会出现agent admitted failure to sign using the key 错误，参考http://blog.chinaunix.net/uid-28228356-id-3510267.html)）

cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys

d.执行下面命令，能够直接进入则表示成功

[root@localhost]#ssh localhost
Last login:Fri Aug  8 13:44:42 2014 from localhost

4.运行测试hadoop

a.到hadoop2.4.0目录下执行下面命令，格式化结点信息，最后一句出现 "shutting down..."，中间没有warn或者fatal error应该就对了。此处可能会出现 STARTUP_MSG: host = java.net.UnknownHostException: localhost.localdomain: localhost.localdomain的提示，可以参考http://lxy2330.iteye.com/blog/1112806进行修改，或者临时通过hostname localhost命令将本机主机名改为localhost.

./bin/hadoop namenode –format

b.执行sbin/start-all.sh启动hadoop第一次可能不成功，这是可以通过先执行一次sbin/stop-all.sh然后在执行sbin/start-all.sh来完成，最后用jps命令查看进程

[root@master hadoop-2.4.1]# ./sbin/start-all.sh

This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh

Starting namenodes on [localhost]

localhost: starting namenode, logging to

/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/logs/hadoop-root-namenode-localhost.out

localhost: starting datanode, logging to

/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/logs/hadoop-root-datanode-localhost.out

Starting secondary namenodes [0.0.0.0]

0.0.0.0: starting secondarynamenode, logging to

/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/logs/hadoop-root-secondarynamenode-localhost.out

starting yarn daemons

starting resourcemanager, logging to

/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/logs/yarn-root-resourcemanager-localhost.out

localhost: starting nodemanager, logging to

/opt/hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/logs/yarn-root-nodemanager-localhost.out

[root@localhost hadoop-2.4.1]# ssh localhost

Last login: Fri Aug  8 13:44:41 2014 from localhost

[root@master ~]# jps

6173  ResourceManager

6005  SecondaryNameNode

5712  NameNode

6270  NodeManager
5821  DataNode

6958  Jps

[root@master~]#

c.浏览器下http://localhost:50070 查看hdfs的页面

d.http://localhost:8088 hadoop进程管理页面

hadoop2.4.1伪分布模式部署的更多相关文章

hadoop2.2.0伪分布模式64位安装
hadoop2.2.0伪分布模式64位安装用到的软件:jdk-6u45-linux-x64.bin,hadoop-2.2.0.x86_64.tar.gz 修改主机名vim /etc/sysconfig ...
Hadoop 伪分布模式安装
( 温馨提示:图片中有id有姓名,不要盗用哦,可参考流程,有问题评论区留言哦 ) 一.任务目标 1.了解Hadoop的3种运行模式 2.熟练掌握Hadoop伪分布模式安装流程 3.培养独立完成Hado ...
hadoop2的伪分布部署
通过我们前面的操作,已经可以编译并且打包产生适合本机的hadoop包,目录是/usr/local/hadoop-2.2.0-src/hadoop-dist/target/hadoop-2.2.0. 使 ...
3-2 Hadoop集群伪分布模式配置部署
Hadoop伪分布模式配置部署一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件文件系统的 ...
Hadoop伪分布模式配置部署
.实验环境说明注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍本实验环境采用带桌面的 ...
centos7搭建hadoop2.10伪分布模式
1.准备一台Vmware虚拟机,添加hdfs用户及用户组,配置网络见 https://www.cnblogs.com/qixing/p/11396835.html 在root用户下添加hdfs用户, ...
Hadoop伪分布模式配置
本作品由Man_华创作,采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可.基于http://www.cnblogs.com/manhua/上的作品创作. 请先按照上一篇文章H ...
【原】Hadoop伪分布模式的安装
Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) ( ...
OS X Yosemite下安装Hadoop2.5.1伪分布式环境
最近开始学习Hadoop,一直使用的是公司配好的环境.用了一段时间后发现对Hadoop还是一知半解,故决定动手在本机上安装一个供学习研究使用.正好自己用的是mac,所以没啥说的,直接安装. 总体流程 ...

随机推荐

tengine + lua 实现流量拷贝
环境搭建参考地址:http://www.cnblogs.com/cp-miao/p/7505910.html cp.lua local res1, res2, action action = ngx. ...
Javascript高级程序设计-问答模式
1.谈谈javascript数组排序方法sort()的使用,重点介绍sort()参数的使用及其内部机制 sort的实现的功能类似JAVA的比较器,数据排序从多维数组的第一维开始排序可以自己定义排序方法 ...
SVN回到历史版本--转载
svn回到历史的某个版本在代码的编写过程中,难免有些错误需要修改,或者想从以前的文件进行代码修改,这样就涉及到版本的追踪,如果你以前提交时日志写的非常清楚,那版本追踪回滚起来就事半功倍.得心应手.下 ...
SQL Server 2008R2发布与订阅的配置
使用SQL Server的发布与订阅可以将一个数据库的数据实时传送到另一个数据库中,使用这种方式与Link Server相比可以减少对数据库的连接次数.下面介绍SQL Server 2008R2发布与 ...
你被美国监控了，美国监控丑闻——"棱镜项目"事件
http://www.ittime.com.cn/index.php?m=content&c=index&a=show&catid=29&id=3795 “棱镜”项目所 ...
web常见几种处理图标方法【转】
方法一: 用background制作小图标像这样,拿到设计稿后把所有的图标放在一张图片上,利用background-position.width.height来控制图标的位置及大小. 代码: .ic ...
js遮罩层弹出显示效果组件化
1.在web开发中经常遇到遮罩层的效果,可以将这种常用方法通用化 function showid(idname){ var isIE = (document.all) ? true : false; ...
ansible远程切换用户执行命令
ansible test -l 10.0.10.1 -e "ansible_become_user=www" -m shell -a "/data/publish/pub ...
CF 316div2 E.Pig and Palindromes
E. Pig and Palindromes Peppa the Pig was walking and walked into the forest. What a strange coincide ...
Scrapy系列教程（3）------Spider（爬虫核心，定义链接关系和网页信息抽取）
Spiders Spider类定义了怎样爬取某个(或某些)站点.包含了爬取的动作(比如:是否跟进链接)以及怎样从网页的内容中提取结构化数据(爬取item). 换句话说.Spider就是您定义爬取的动作 ...

hadoop2.4.1伪分布模式部署

hadoop2.4.1伪分布模式部署的更多相关文章

随机推荐

热门专题