基于centos6.5 hadoop 伪分布式安装
步骤1:修改IP 地址和主机名:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-eth0” ,可以 cd /etc/sysconfig/network-scripts/ 这个目录查看以ifcfg-***开头的文件,就是你的网卡文件。再进行编辑 vi /etc/sysconfig/network-scripts/ifcfg-***
主要修改项为:
BOOTPROTO="static" ###
IPADDR="192.168.100.70" ###
NETMASK="255.255.255.0" ###
GATEWAY="192.192.100.1" ###
BOOTPROTO 修改为静态
IPADDR 要修改的具体ip
NETMASK 网关
GATEWAY 网关
主机名修改:
Vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=hadoop1
hostname 查看主机名
步骤2:修改主机名与ip地址对应关系
vim /etc/hosts
192.168.100.70 hadoop1
步骤3:关闭防火墙
查看防护墙状态
service iptables status
关闭
service iptables stop
查看防火墙开机启动状态
chkconfig iptables --list
关闭开机启动
chkconfig iptables off
步骤4:安装jdk 首先下载jdk7 jdk-7u79-linux-x64.gz
将jdk-7u79-linux-x64.gz 复制到/usr/local/目录下
解压:tar -zxvf jdk-7u79-linux-x64.gz 解压成功后会在/usr/local/目录下产生 java-1.7.0_79目录。
配置环境变量:
vim /etc/profile
在文件最下面添加如下内容:
export JAVA_HOME=/usr/local/java-1.7.0_79
exprot PATH=$PATH:$JAVA_HOME/bin
保存退出
使上面文件立即生效:
source /etc/profile
验证安装是否成功:
java -version
如果出现jdk1.7之类字样代表安装成功
步骤5:安装hadoop2.7.1
上传hadoop安装包到 /usr/local/hadoop-2.7.1.tar.gz
并进行解压 :
tar -zxvf hadoop-2.7.1.tar.gz
只有解压之后才可以操作以下步骤。
伪分布式需要修改5个配置文件
3.1配置hadoop
第一个:hadoop-env.sh(所在目录/usr/local/hadoop-2.7.1/etc/hadoop/)
vim hadoop-env.sh
#第27行
export JAVA_HOME=/usr/local/java-1.7.0_79
以下几个xml都在/usr/local/hadoop-2.7.1/etc/haoop/目录下
第二个:core-site.xml
<!-- 制定HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop1:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop-2.7.1/tmp</value>
</property>
备注:这里的hadoop1是计算机名
第三个:hdfs-site.xml
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
mv mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
<!-- 指定mr运行在yarn上 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
第五个:yarn-site.xml
<!-- 指定YARN的老大(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
//备注这里的hadoop1是计算机名
3.2将hadoop添加到环境变量
vim /etc/proflie
export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export HADOOP_HOME=/usr/local/hadoop-2.7.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
修改完成后profile,使之立即生效命令:
source /etc/profile
步骤6:验证与测试
1格式化namenode(是对namenode进行初始化)
hdfs namenode -format (hadoop namenode -format)
2启动hadoop
先启动HDFS
sbin/start-dfs.sh
再启动YARN
sbin/start-yarn.sh
3验证是否启动成功
使用jps命令验证
3504 DataNode
3386 NameNode
3813 ResourceManager
4087 NodeManager
3664 SecondaryNameNode
4206 Jps
http://192.168.100.70:50070 (HDFS管理界面)
http://192.168.100.70:8088 (MR管理界面)
测试hdfs:
上传文件进行测试
hadoop fs -put /usr/local/hadoop/hadoop-2.7.1.tar.gz hdfs://hadoop1:9000/hadoop
“/usr/local/hadoop/hadoop-2.7.1.tar.gz”是本地一个文件,“hdfs://hadoop1:9000/hadoop”代表hdfs上的一个文件位置
下载文件测试 :
hadoop fs -get hdfs://hadoop1:9000/hadoop /home/hd
测试yarn
首先进入hadoop的安装目录下的/share/hadoop/mapreduce/ ,
再使用hadoop-mapreduce-examples-2.7.1.jar
新建一个文件words文件内容如下,并上传到hdfs中
Hello tom
Hello jer
Hello jack
Hello kety
Hello tom
上传到hdfs;
hadoop fs -put /usr/hadoop/words hdfs://hadoop1:9000/words
hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount hdfs://hadoop1:9000/words hdfs://hadoop1:9000/wordresult
下载hdfs://hadoop1:9000/wordresult 可以查看内容
Hello 5
jack 1
jer 1
kety 1
tom 2
代表hadoop伪分部式安装成功
基于centos6.5 hadoop 伪分布式安装的更多相关文章
- hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMn ...
- apache hadoop 伪分布式安装
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cen ...
- 基于Centos搭建 Hadoop 伪分布式环境
软硬件环境: CentOS 7.2 64 位, OpenJDK- 1.8,Hadoop- 2.7 关于本教程的说明 云实验室云主机自动使用 root 账户登录系统,因此本教程中所有的操作都是以 roo ...
- 【Hadoop学习之二】Hadoop伪分布式安装
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 伪分布式就 ...
- hadoop 伪分布式安装
0. 关闭防火墙 重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启 ...
- Hadoop伪分布式安装步骤(hadoop0.20.2版本)
最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一 ...
- Hadoop 伪分布式安装、运行测试例子
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...
- [大数据] hadoop伪分布式安装
注意:节点主机的hostname不要带"_"等字符,否则会报错. 一.安装jdk rpm -i jdk-7u80-linux-x64.rpm 配置java环境变量: vi + /e ...
- hadoop伪分布式安装
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址 说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows ...
随机推荐
- session of express
[session of express] 1.express-session 一个提供session功能库 npm install express-session --save var session ...
- Shader基础(渲染管线)
Shader原理部分 渲染绘图管线流程: 1.顶点处理(坐标系的转换) 一个模型有自身的方向(前方,上方,右方等)和中心点,既本地坐标系: 将这个模型放到场景当中,通过场景中的世界坐标原点和世 ...
- 对程序"加料"
我们如果想对已有的程序做手脚,就要在原有的结构中添加自己的代码,这样当用户在打开这个做过手脚的程序时就会自动运行其中我们加进去的代码,至于这些代码能做什么,你懂得.这个实验的目的是在一个EXE可执行文 ...
- rsync+inotify实现数据实时同步
rsync rsync是linux系统下的数据镜像备份工具.支持远程同步,本地复制,或者与其他SSH.rsync主机同步. 优点: 1).可以镜像保存整个目录树和文件系统.保存源目录整个目录树和文件系 ...
- 【Scheme】树结构
将表作为序列的表示方式,可以推广到元素本身也是序列的序列.例如,我们可以认为对象((1 2) 3 4)是通过(cons (list 1 2) (list 3 4))构造出来的. 这个表包含三个项,其中 ...
- php苹果内购订单验证
/** * 21000 App Store不能读取你提供的JSON对象 * 21002 receipt-data域的数据有问题 * 21003 receipt无法通过验证 * 21004 提供的sha ...
- openstack(Pike 版)集群部署(五)--- Neutron 部署
一.介绍 参照官网部署:https://docs.openstack.org/neutron/pike/install/install-rdo.html 继续上一博客进行部署:http://ww ...
- oracle数据库查询出多条数据,合并,之后列转行
select B.enterprise_code, B.enterprise_name, sum(B.h0_overnum) AS over00, sum(B.h1_overnum) AS over0 ...
- 微信小程序编译包的获取与解压——在手机中获取小程序编译包wxapkg
准备工作: 微信关注需要下载编译包的小程序,然后点进去看一下,微信就会自动下载相应的编译包到手机上了. 获取小程序编译包: 据说root手机可以直接在手机的文件管理中查找wxapkg文件,自己尝试了下 ...
- Python常用库大全,看看有没有你需要的
作者:史豹链接:https://www.zhihu.com/question/20501628/answer/223340838来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明 ...