Hadoop新生报到（一） hadoop2.6.0伪分布式配置详解

　　首先先不看理论，搭建起环境之后再看；

　　搭建伪分布式是为了模拟环境，调试方便。

　　电脑是win10，用的虚拟机VMware Workstation 12 Pro，跑的Linux系统是centos6.5 ，装的hadoop2.6.0，jdk1.8；

　　1.准备工作

　　准备工作：把JDK和Hadoop安装包上传到linux系统（hadoop用户的根目录）

　　系统环境：IP：192.168.80.99，

　　linux用户：

　　root/123456，hadoop/123456

　　主机名：node

　　把防火墙关闭，root执行：service iptables stop

　　2.jdk安装

　　1.在hadoop用户的根目录，Jdk解压，（hadoop用户操作）tar -zxvf jdk-8u65-linux-x64.tar.gz 解压完成后，在hadoop用户的根目录有一个jdk1.8.0_65目录

　　2.配置环境变量，需要修改/etc/profile文件（root用户操作）切到root用户，输入su命令 vi /etc/profile 进去编辑器后，输入i，进入vi编辑器的插入模式在profile文件最后添加

JAVA_HOME=/home/hadoop/jdk1.8.0_65

export PATH=$PATH:$JAVA_HOME/bin

　　编辑完成后，按下esc退出插入模式输入：，这时在左下角有一个冒号的标识

　　q 退出不保存

　　wq 保存退出

　　q! 强制退出

　　3.把修改的环境变量生效（hadoop用户操作）

　　执行source /etc/profile

　　4.执行 java -version 查看版本，如果成功证明jdk配置成功

　　3.Hadoop 安装

　 1.在hadoop用户的根目录，解压（hadoop用户操作）

　　　　tar -zxvf hadoop-2.6.0.tar.gz

　　　解压完成在hadoop用户的根目录下有一个hadoop-2.6.0目录

　　2.修改配置文件hadoop-2.6.0/etc/hadoop/hadoop-env.sh（hadoop用户操作）

　　　　export JAVA_HOME=/home/hadoop/jdk1.8.0_65

　　3.修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml，添加（hadoop用户操作）

<name>fs.defaultFS</name>

</property>

　　4.修改配置文件hadoop-2.6.0/etc/hadoop/hdfs-site.xml，添加（hadoop用户操作）

<name>dfs.replication</name>

</property>

　　5.修改修改配置文件hadoop-2.6.0/etc/hadoop/mapred-site.xml （hadoop用户操作）,这个文件没有，需要复制一份

　　　　cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

　　　　添加

<name>mapreduce.framework.name</name>

</property>

　　6.修改配置文件hadoop-2.6.0/etc/hadoop/yarn-site.xml，添加（hadoop用户操作）

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

　　7.修改主机名称（root用户操作），重启生效

　　　　vi /etc/sysconfig/network

　　修改HOSTNAME的值为用户名

　　8.修改/etc/hosts文件（root用户操作）,添加： ip 主机名称

　　　　192.168.44.199（用自己的ip，下边讲如何获得） node

　　附：查看ip地址

　　编辑-->虚拟网络编辑器

　　net模式，选DHCP设置，得到ip地址起始

net设置，得到网关

点右边小电脑，选择 VPN Connections-->Configue VPN

选中eth0，点有右边edit

选择IP Settings ，根据自己的ip按图修改，Address就是你的ip地址，在起始ip地址和结束ip地址之间选一个就行

　　9.格式化HDFS，在hadoop解压目录下，执行如下命令：（hadoop用户操作）

　　　　bin/hdfs namenode -format

　　注意：格式化只能操作一次，如果因为某种原因，集群不能用，需要再次格式化，需要把上一次格式化的信息删除，在/tmp目录里执行 rm –rf *

　　10.启动集群，在hadoop解压目录下，执行如下命令：（hadoop用户操作，截图用机后来改过，主机为gp）

　　　　启动集群：sbin/start-all.sh 需要输入四次当前用户的密码(通过配置ssh互信解决，截图用机已经配置过ssh不用输密码)

　　　启动后，在命令行输入jps有以下输出

关闭集群：sbin/stop-all.sh 需要输入四次当前用户的密码(通过配置ssh互信解决，我的同上)

　　4.SSH互信配置（hadoop用户操作）
　　rsa加密方法，公钥和私钥
　　1.生成公钥和私钥
　　在命令行执行ssh-keygen，然后回车，然后会提示输入内容，什么都不用写，一路回车
　　在hadoop用户根目录下，有一个.ssh目录
　　id_rsa 私钥
　　id_rsa.pub 公钥
　　known_hosts 通过SSH链接到本主机，都会在这里有记录
　　2.把公钥给信任的主机(本机)
　　在命令行输入ssh-copy-id 主机名称
　　ssh-copy-id hadoop
　　复制的过程中需要输入信任主机的密码
　　3.验证，在命令行输入：ssh 信任主机名称
　　ssh hadoop
　　如果没有提示输入密码，则配置成功

　　至此，大功告成。

Hadoop新生报到（一） hadoop2.6.0伪分布式配置详解的更多相关文章

琐碎-hadoop2.2.0伪分布式和完全分布式安装（centos6.4）
环境是centos6.4-32,hadoop2.2.0 伪分布式文档:http://pan.baidu.com/s/1kTrAcWB 完全分布式文档:http://pan.baidu.com/s/1s ...
Hadoop2.5.0伪分布式环境搭建
本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...
在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
hadoop 0.20.2伪分布式安装详解
adoop 0.20.2伪分布式安装详解 hadoop有三种运行模式: 伪分布式不需要安装虚拟机,在同一台机器上同时启动5个进程,模拟分布式. 完全分布式至少有3个节点,其中一个做master,运行名 ...
安装hadoop2.6.0伪分布式环境
集群环境搭建请见:http://blog.csdn.net/jediael_lu/article/details/45145767 一.环境准备 1.安装linux.jdk 2.下载hadoop2.6 ...
ubuntu14.04搭建Hadoop2.9.0伪分布式环境
本文主要参考给力星的博文——Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 一些准备工作的基本步骤和步骤具体说明本文不再列出,文章中提到的“见参考”均指以上 ...
安装hadoop2.6.0伪分布式环境分类： A1_HADOOP 2015-04-27 18:59 409人阅读评论(0) 收藏
集群环境搭建请见:http://blog.csdn.net/jediael_lu/article/details/45145767 一.环境准备 1.安装linux.jdk 2.下载hadoop2.6 ...
Centos7.0配置Hadoop2.7.0伪分布式
一.ssh免密登录 1.命令ssh-keygen. overwrite输入y一路回车 2.将生成的密钥发送到本机 ssh-copy-id localhost中间会询问是否继续输入“yes” 3.测试免 ...
Ubuntu15.10下Hadoop2.6.0伪分布式环境安装配置及Hadoop Streaming的体验
Ubuntu用的是Ubuntu15.10Beta2版本,正式的版本好像要到这个月的22号才发布.参考的资料主要是http://www.powerxing.com/install-hadoop-clus ...

随机推荐

【译】Reflection.Emit vs. CodeDOM
原文:http://ayende.com/blog/1606/reflection-emit-vs-codedom Both technologies allow you to generate ex ...
linux上搭建zookeeper
1.zookeeper介绍 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件.它是一个为分布式应用提 ...
nginx是什么nginx安装与配置之windows版
1.nginx是什么为了快速了解nginx我们先引用网上的nginx介绍: Nginx ("engine x") 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP ...
nginx 配置https 负载均衡
1.Winodw安装openssl工具(生成SSL证书用的)免编译版本下载: http://slproweb.com/products/Win32OpenSSL.html 注意:如果openssl在使 ...
Linux 开机引导流程
Linux 开机启动流程 BIOS(Basic Input Output System)是 PC 机启动时加载的第一个软件.其实,它是一组固化到计算机主板上一个芯片上的程序,它保存着计算机最重要的输入 ...
js动态参数作为Object的属性取值
js动态参数作为Object的属性取值var myObj = {"a":1,"b":2};var a = 'a';myObj[a] 就可以获取到属性a的值了
利用wamp配置虚拟主机
第一步:打开wamp--Apache--httpd.conf找到# Virtual hosts 一行,把其下面的一行中的#去掉.
.net MVC开源项目分享(1) 项目的基本情况
介绍本项目是mvcsolution框架的分支. 原项目地址:https://github.com/leotsai/mvcsolution/ 本项目地址:https://github.com/hewe ...
html标签及用法小结
html标签小结这几天学习了html,才发现各种标签真是多的不行,所以打算把一些个常用的标签拿出来稍微说一下. *** 常用基础标签大体上分了三类: 带有语义的标签带有一定样式的标签(此类标签页 ...
python实现希尔排序(已编程实现)
希尔排序: 观察一下”插入排序“:其实不难发现她有个缺点: 如果当数据是”5, 4, 3, 2, 1“的时候,此时我们将“无序块”中的记录插入到“有序块”时,估计俺们要崩盘, 每次插入都要移动位置,此 ...

Hadoop新生报到（一） hadoop2.6.0伪分布式配置详解

Hadoop新生报到（一） hadoop2.6.0伪分布式配置详解的更多相关文章

随机推荐

热门专题