基于centos6.5 hadoop 伪分布式安装
步骤1:修改IP 地址和主机名:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-eth0” ,可以 cd /etc/sysconfig/network-scripts/ 这个目录查看以ifcfg-***开头的文件,就是你的网卡文件。再进行编辑 vi /etc/sysconfig/network-scripts/ifcfg-***
主要修改项为:
BOOTPROTO="static" ###
IPADDR="192.168.100.70" ###
NETMASK="255.255.255.0" ###
GATEWAY="192.192.100.1" ###
BOOTPROTO 修改为静态
IPADDR 要修改的具体ip
NETMASK 网关
GATEWAY 网关
主机名修改:
Vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=hadoop1
hostname 查看主机名
步骤2:修改主机名与ip地址对应关系
vim /etc/hosts
192.168.100.70 hadoop1
步骤3:关闭防火墙
查看防护墙状态
service iptables status
关闭
service iptables stop
查看防火墙开机启动状态
chkconfig iptables --list
关闭开机启动
chkconfig iptables off
步骤4:安装jdk 首先下载jdk7 jdk-7u79-linux-x64.gz
将jdk-7u79-linux-x64.gz 复制到/usr/local/目录下
解压:tar -zxvf jdk-7u79-linux-x64.gz 解压成功后会在/usr/local/目录下产生 java-1.7.0_79目录。
配置环境变量:
vim /etc/profile
在文件最下面添加如下内容:
export JAVA_HOME=/usr/local/java-1.7.0_79
exprot PATH=$PATH:$JAVA_HOME/bin
保存退出
使上面文件立即生效:
source /etc/profile
验证安装是否成功:
java -version
如果出现jdk1.7之类字样代表安装成功
步骤5:安装hadoop2.7.1
上传hadoop安装包到 /usr/local/hadoop-2.7.1.tar.gz
并进行解压 :
tar -zxvf hadoop-2.7.1.tar.gz
只有解压之后才可以操作以下步骤。
伪分布式需要修改5个配置文件
3.1配置hadoop
第一个:hadoop-env.sh(所在目录/usr/local/hadoop-2.7.1/etc/hadoop/)
vim hadoop-env.sh
#第27行
export JAVA_HOME=/usr/local/java-1.7.0_79
以下几个xml都在/usr/local/hadoop-2.7.1/etc/haoop/目录下
第二个:core-site.xml
<!-- 制定HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop1:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop-2.7.1/tmp</value>
</property>
备注:这里的hadoop1是计算机名
第三个:hdfs-site.xml
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
mv mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
<!-- 指定mr运行在yarn上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
第五个:yarn-site.xml
<!-- 指定YARN的老大(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
//备注这里的hadoop1是计算机名
3.2将hadoop添加到环境变量
vim /etc/proflie
export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export HADOOP_HOME=/usr/local/hadoop-2.7.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
修改完成后profile,使之立即生效命令:
source /etc/profile
步骤6:验证与测试
1格式化namenode(是对namenode进行初始化)
hdfs namenode -format (hadoop namenode -format)
2启动hadoop
先启动HDFS
sbin/start-dfs.sh
再启动YARN
sbin/start-yarn.sh
3验证是否启动成功
使用jps命令验证
3504 DataNode
3386 NameNode
3813 ResourceManager
4087 NodeManager
3664 SecondaryNameNode
4206 Jps
http://192.168.100.70:50070 (HDFS管理界面)
http://192.168.100.70:8088 (MR管理界面)
测试hdfs:
上传文件进行测试
hadoop fs -put /usr/local/hadoop/hadoop-2.7.1.tar.gz hdfs://hadoop1:9000/hadoop
“/usr/local/hadoop/hadoop-2.7.1.tar.gz”是本地一个文件,“hdfs://hadoop1:9000/hadoop”代表hdfs上的一个文件位置
下载文件测试 :
hadoop fs -get hdfs://hadoop1:9000/hadoop /home/hd
测试yarn
首先进入hadoop的安装目录下的/share/hadoop/mapreduce/ ,
再使用hadoop-mapreduce-examples-2.7.1.jar
新建一个文件words文件内容如下,并上传到hdfs中
Hello tom
Hello jer
Hello jack
Hello kety
Hello tom
上传到hdfs;
hadoop fs -put /usr/hadoop/words hdfs://hadoop1:9000/words
hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount hdfs://hadoop1:9000/words hdfs://hadoop1:9000/wordresult
下载hdfs://hadoop1:9000/wordresult 可以查看内容
Hello 5
jack 1
jer 1
kety 1
tom 2
代表hadoop伪分部式安装成功
基于centos6.5 hadoop 伪分布式安装的更多相关文章
- hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMn ...
- apache hadoop 伪分布式安装
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cen ...
- 基于Centos搭建 Hadoop 伪分布式环境
软硬件环境: CentOS 7.2 64 位, OpenJDK- 1.8,Hadoop- 2.7 关于本教程的说明 云实验室云主机自动使用 root 账户登录系统,因此本教程中所有的操作都是以 roo ...
- 【Hadoop学习之二】Hadoop伪分布式安装
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 伪分布式就 ...
- hadoop 伪分布式安装
0. 关闭防火墙 重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启 ...
- Hadoop伪分布式安装步骤(hadoop0.20.2版本)
最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一 ...
- Hadoop 伪分布式安装、运行测试例子
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...
- [大数据] hadoop伪分布式安装
注意:节点主机的hostname不要带"_"等字符,否则会报错. 一.安装jdk rpm -i jdk-7u80-linux-x64.rpm 配置java环境变量: vi + /e ...
- hadoop伪分布式安装
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址 说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows ...
随机推荐
- Win10 Fn键切换
[Win10 Fn键切换] 选择 FN+ESC 参考:https://zhidao.baidu.com/question/626159613433698444.html
- DRDS 概述
DRDS 概述 更新时间:2017-08-04 13:53:50 分布式关系型数据库服务(Distributed Relational Database Service , 简称 DRDS ) ...
- apache服务器伪静态配置说明
apache服务器伪静态配置说明: 第一种 .如果是多城市版分类并且使用了城市二级域名即(多城市+多域名),请修改apache的配置文件,把以下代码添加到配置文件的最后一行即可,注意把qibosoft ...
- poj2635(千进制取模+同余模定理)
题目链接:https://www.cnblogs.com/kuangbin/archive/2012/04/01/2429463.html 题意:给出大数s (s<=10100) ,L (< ...
- Centos 7 下 Zabbix 3.4.x 服务搭建
一.zabbix 介绍 zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案.zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让 ...
- POJ-3078.Shuffle'm Up(简单模拟题)
这道题做了有四个小时吧,今天一整天都处于边玩边学的状态,我很是不喜欢...一开始用了20分钟模拟,过了样例后TLE了,就在考虑是不是判断是否重复判定的数组开大了,结果一直蛙,后面想到了map判重,结果 ...
- HTTP 基础
HTTP简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送 ...
- @CookieValue使用须知
------------------------siwuxie095 @CookieValue 使用须知 使用 @CookieV ...
- Qt的pro文件--项目配置的部分字段
Qt项目配置的部分字段: 库: LIBS += -L /usr/local/lib -lpcap INCLUDEPATH += /usr/local/include/
- unitest中HTML测试报告的优化
简介: 为每一个测试用例添加说明,那么将会使测试报告更加易读,工作中汇报数据的技巧 其实就是添加u“msg”即可 # -*- coding:UTF-8 -*- __autor__ = 'zhouli' ...