基于centos6.5 hadoop 伪分布式安装
步骤1:修改IP 地址和主机名:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-eth0” ,可以 cd /etc/sysconfig/network-scripts/ 这个目录查看以ifcfg-***开头的文件,就是你的网卡文件。再进行编辑 vi /etc/sysconfig/network-scripts/ifcfg-***
主要修改项为:
BOOTPROTO="static" ###
IPADDR="192.168.100.70" ###
NETMASK="255.255.255.0" ###
GATEWAY="192.192.100.1" ###
BOOTPROTO 修改为静态
IPADDR 要修改的具体ip
NETMASK 网关
GATEWAY 网关
主机名修改:
Vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=hadoop1
hostname 查看主机名
步骤2:修改主机名与ip地址对应关系
vim /etc/hosts
192.168.100.70 hadoop1
步骤3:关闭防火墙
查看防护墙状态
service iptables status
关闭
service iptables stop
查看防火墙开机启动状态
chkconfig iptables --list
关闭开机启动
chkconfig iptables off
步骤4:安装jdk 首先下载jdk7 jdk-7u79-linux-x64.gz
将jdk-7u79-linux-x64.gz 复制到/usr/local/目录下
解压:tar -zxvf jdk-7u79-linux-x64.gz 解压成功后会在/usr/local/目录下产生 java-1.7.0_79目录。
配置环境变量:
vim /etc/profile
在文件最下面添加如下内容:
export JAVA_HOME=/usr/local/java-1.7.0_79
exprot PATH=$PATH:$JAVA_HOME/bin
保存退出
使上面文件立即生效:
source /etc/profile
验证安装是否成功:
java -version
如果出现jdk1.7之类字样代表安装成功
步骤5:安装hadoop2.7.1
上传hadoop安装包到 /usr/local/hadoop-2.7.1.tar.gz
并进行解压 :
tar -zxvf hadoop-2.7.1.tar.gz
只有解压之后才可以操作以下步骤。
伪分布式需要修改5个配置文件
3.1配置hadoop
第一个:hadoop-env.sh(所在目录/usr/local/hadoop-2.7.1/etc/hadoop/)
vim hadoop-env.sh
#第27行
export JAVA_HOME=/usr/local/java-1.7.0_79
以下几个xml都在/usr/local/hadoop-2.7.1/etc/haoop/目录下
第二个:core-site.xml
<!-- 制定HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop1:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop-2.7.1/tmp</value>
</property>
备注:这里的hadoop1是计算机名
第三个:hdfs-site.xml
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
mv mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
<!-- 指定mr运行在yarn上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
第五个:yarn-site.xml
<!-- 指定YARN的老大(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
//备注这里的hadoop1是计算机名
3.2将hadoop添加到环境变量
vim /etc/proflie
export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export HADOOP_HOME=/usr/local/hadoop-2.7.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
修改完成后profile,使之立即生效命令:
source /etc/profile
步骤6:验证与测试
1格式化namenode(是对namenode进行初始化)
hdfs namenode -format (hadoop namenode -format)
2启动hadoop
先启动HDFS
sbin/start-dfs.sh
再启动YARN
sbin/start-yarn.sh
3验证是否启动成功
使用jps命令验证
3504 DataNode
3386 NameNode
3813 ResourceManager
4087 NodeManager
3664 SecondaryNameNode
4206 Jps
http://192.168.100.70:50070 (HDFS管理界面)
http://192.168.100.70:8088 (MR管理界面)
测试hdfs:
上传文件进行测试
hadoop fs -put /usr/local/hadoop/hadoop-2.7.1.tar.gz hdfs://hadoop1:9000/hadoop
“/usr/local/hadoop/hadoop-2.7.1.tar.gz”是本地一个文件,“hdfs://hadoop1:9000/hadoop”代表hdfs上的一个文件位置
下载文件测试 :
hadoop fs -get hdfs://hadoop1:9000/hadoop /home/hd
测试yarn
首先进入hadoop的安装目录下的/share/hadoop/mapreduce/ ,
再使用hadoop-mapreduce-examples-2.7.1.jar
新建一个文件words文件内容如下,并上传到hdfs中
Hello tom
Hello jer
Hello jack
Hello kety
Hello tom
上传到hdfs;
hadoop fs -put /usr/hadoop/words hdfs://hadoop1:9000/words
hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount hdfs://hadoop1:9000/words hdfs://hadoop1:9000/wordresult
下载hdfs://hadoop1:9000/wordresult 可以查看内容
Hello 5
jack 1
jer 1
kety 1
tom 2
代表hadoop伪分部式安装成功
基于centos6.5 hadoop 伪分布式安装的更多相关文章
- hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMn ...
- apache hadoop 伪分布式安装
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cen ...
- 基于Centos搭建 Hadoop 伪分布式环境
软硬件环境: CentOS 7.2 64 位, OpenJDK- 1.8,Hadoop- 2.7 关于本教程的说明 云实验室云主机自动使用 root 账户登录系统,因此本教程中所有的操作都是以 roo ...
- 【Hadoop学习之二】Hadoop伪分布式安装
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 伪分布式就 ...
- hadoop 伪分布式安装
0. 关闭防火墙 重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启 ...
- Hadoop伪分布式安装步骤(hadoop0.20.2版本)
最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一 ...
- Hadoop 伪分布式安装、运行测试例子
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...
- [大数据] hadoop伪分布式安装
注意:节点主机的hostname不要带"_"等字符,否则会报错. 一.安装jdk rpm -i jdk-7u80-linux-x64.rpm 配置java环境变量: vi + /e ...
- hadoop伪分布式安装
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址 说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows ...
随机推荐
- Pushlet实现后台信息推送(二)
上一篇日志利用推送源周期性地向订阅了某一事件的所有网页端推送信息,但怎么实现向特定的某一个用户推送信息呢,想象一个网络聊天室,怎么向单独的一个好友私聊呢.问题的关键就是那个SessionID,Push ...
- 求值器本质--eval&apply
最近跟着(How to Write a (Lisp) Interpreter (in Python))使用python实现了一个简易的scheme解释器.不得不说使用python这类动态语言实现不要太 ...
- 使用WebStorm自动提示nodejs的有关代码
- 【Django】关于前端配置
今天在网上课程了学了一下前端配置,感觉搭这个环境安装了不少东西,自己都有点混乱,现在整理一下思路: 1.nvm 即Note Version Manager用来管理node版本的工具: windows版 ...
- centos搭建OPENldap
LDAP是轻量目录访问协议,英文全称是Lightweight Directory Access Protocol,一般都简称为LDAP.它是基于X.500标准的,但是简单多了并且可以根据需要定制.与X ...
- Markdown总结整理
今天朋友(SolskGare)向我普及了一个很方便的文本编辑语言Markdown,才意识到之前自己用鼠标一点一点的排版有多low,而且往往还是费力不讨好.今天我就整理一下Markdown的用法,真的是 ...
- TOJ4439微积分――曲线积分(数学,模拟)
传送门:点我 格林公式P,Q为关于x,y的函数. 现在为了方便起见,现给出x的积分上限1,积分下限0, y的积分上限x,积分下限0. P只是关于Y的函数,Q只是关于X的函数. 输入 开始输入为测试组数 ...
- Mac快捷键大全
Android Studio command+option+L:格式化代码 Visual Studio Code option+shift+f:格式化代码 先按command+k,再按command+ ...
- MYSQL之水平分区----MySQL partition分区I(5.1)
一. 分区的概念 二. 为什么使用分区?(优点) 三. 分区类型 四. 子分区 五. 对分区进行修改(增加.删除.分解.合并) 六 ...
- HDU 6118 度度熊的交易计划(最小费用最大流)
Problem Description度度熊参与了喵哈哈村的商业大会,但是这次商业大会遇到了一个难题: 喵哈哈村以及周围的村庄可以看做是一共由n个片区,m条公路组成的地区. 由于生产能力的区别,第i个 ...