Linux环境搭建Hadoop伪分布模式
Hadoop有三种分布模式:单机模式、伪分布、全分布模式,相比于其他两种,伪分布是最适合初学者开发学习使用的,可以了解Hadoop的运行原理,是最好的选择。接下来,就开始部署环境。
首先要安装好Linux环境,可以是真机,也可以是虚拟机,我的环境是VMWare下安装的CentOS 6.3的虚拟机,如果你还没有安装好Linux环境,可以参考我的另一篇文章:window7环境下VMWare自定义安装Linux虚拟机完全教程,希望可以帮到你。
等你安装好了Linux环境,我们就可以真正开始部署hadoop了。
需要准备好Linux版本的jdk和hadoop的压缩包,可以分别去官网下载,我也提供我的资源给大家参考:链接:http://pan.baidu.com/s/1mhKixFq 密码:6lqt;
1.添加用户和组,并上传文件
- 用管理员root登录Linux,创建hadoop用户组:groupadd hadoop,
- 创建用户:useradd hadoop -g hadoop ,
- 使用传输软件将到Linux系统的任意目录下,如/root/sethadoop;
- 使用命令:su hadoop切换用户,查看是否创建成功,出现[root@localhost ~]表示创建成功;
- 然后exit退出到root用户。
- (注:在学习安装Hadoop之前,最好学习和熟悉一下Linux的常用命令)。
2.Host的配置
vim /etc/hosts 进入配置文件,添加linux主机的ip地址和主机名;需要查看你自己的主机名,ifconfig;
vim /etc/sysconfig/network,设置主机名,以后所有的主机名都必须统一;
source /etc/sysconfig/network ,重新加载配置文件后生效;
logout 登出后重新登录,发现主机名变为[root@master ~]#
修改权限:chmod 600 ~/.ssh/authorized_keys,chmod 700 .ssh/
测试一下,ssh master,-》yes,然后退出hadoop登录,exit
4.JDK的安装
进入到jdk安装包存放的目录下,我的是/root/set,
创建安装Java的目录,mkdir /usr/java
解压到/usr/java:tar -zxvf jdk-7u9-linux-i586.tar.gz -C /usr/java
为Java安装目录建一个软连接,方便使用:ln -s jdk1.7.0_09/ jdk
(以上操作都视你的jdk版本和存储位置而定,切忌照搬)
修改环境变量,vim /etc/profile ,在文件末尾添加如下信息,也可再添加
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar;
有过window中jdk安装经验的童鞋会比较熟悉的。
退出保存文件,重新加载配置文件,source /etc/profile.
验证Java是否安装成功:java -version,这个有Java开发经验的都知道吧。。。
5.hadoop的安装
使用root用户登录,进入你的hadoop压缩包的目录,
解压:tar -zxvf hadoop-1.0.4.tar.gz -C /opt/,解压目录/usr/也行,根据自己选择;
进入/opt目录下,更改一下文件夹的名字,方便使用,mv hadoop-1.0.4/ hadoop/;
修改用户组和权限:chown -R hadoop:hadoop hadoop/
登录hadoop用户,su hadoop;
配置 vim conf/hadoop-env.sh,在末尾添加:
第二个变量可以不是256M,根据你的内存大小而定,也可以是512M或更大;
配置 vim conf/core-site.xml 在<configuration>中添加:
配置vim conf/hdfs-site.xml,如下,由于是伪分布式,所以replication配1就行
配置 conf/mapred-site.xml:主机名要一致;
配置辅助接点名称,conf/masters,就添加一个master就行
配置子节点,conf/slave 也是添加一个master就行
经过以上步骤,hadoop的配置文件就全部配置好了,不要忘记:wq退出保存哦。
格式化分布式文件系统:进入hadoop的bin目录,
执行 ./hadoop namenode -format,完成后是这样的:
启动hadoop集群:./start-all.sh,
检查hadoop结点是否全部启动成功:共6个结点,一个都不能少,
如果哪个结点没有出现,说明其出错了,请进入logs目录下的日志文件查看相应的日志文件,并修改,
具体方法请查看其它网络资源;
查看hadoop集群的状态信息:
在浏览器地址栏输入:http://192.168.64.128:50070/ (ip是你自己服务器的ip)
出现上图信息,说明你的hadoop伪分布模式就配置成功了!
(注:如果运行jps没有问题,而上面的页面加载不出来的话,请试着关闭防火墙:service iptables stop)
Linux环境搭建Hadoop伪分布模式的更多相关文章
- 【Hadoop环境搭建】Centos6.8搭建hadoop伪分布模式
阅读目录 ~/.ssh/authorized_keys 把公钥加到用于认证的公钥文件中,authorized_keys是用于认证的公钥文件 方式2: (未测试,应该可用) 基于空口令创建新的SSH密钥 ...
- Ubuntu下hadoop环境的搭建(伪分布模式)
Ubuntu下hadoop环境的搭建(伪分布模式) 一.必要资源的下载 1.Java jdk(jdk-8u25-linux-x64.tar.gz)的下载 具体链接为: http://www.oracl ...
- Linux环境下Hadoop集群搭建
Linux环境下Hadoop集群搭建 前言: 最近来到了武汉大学,在这里开始了我的研究生生涯.昨天通过学长们的耐心培训,了解了Hadoop,Hdfs,Hive,Hbase,MangoDB等等相关的知识 ...
- Linux 下搭建 Hadoop 环境
Linux 下搭建 Hadoop 环境 作者:Grey 原文地址: 博客园:Linux 下搭建 Hadoop 环境 CSDN:Linux 下搭建 Hadoop 环境 环境要求 操作系统:CentOS ...
- 【原】Hadoop伪分布模式的安装
Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) ( ...
- Hadoop伪分布模式操作
http://blog.csdn.net/wangloveall/article/details/20195813 摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习.开发和调试. 关键 ...
- hadoop伪分布模式安装
软件环境 操作系统 : OracleLinux-R6-U6 主机名: hadoop java: jdk1.7.0_75 hadoop: hadoop-2.4.1 环境搭建 1.软件安装 由于所需的软 ...
- hadoop伪分布模式的配置和一些常用命令
大数据的发展历史 3V:volume.velocity.variety(结构化和非结构化数据).value(价值密度低) 大数据带来的技术挑战 存储容量不断增加 获取有价值的信息的难度:搜索.广告.推 ...
- Hadoop 伪分布模式安装
( 温馨提示:图片中有id有姓名,不要盗用哦,可参考流程,有问题评论区留言哦 ) 一.任务目标 1.了解Hadoop的3种运行模式 2.熟练掌握Hadoop伪分布模式安装流程 3.培养独立完成Hado ...
随机推荐
- spring bean范围
总结: 实例代码具体解释: 文件夹结构 Car.java package com.coslay.beans.autowire; public class Car { private String br ...
- 完整的堆栈JavaScript路(十五)HTML5 focus 扩大 (扩展点)
HTML5 加入辅助管理 focus 产品特点, 有办法获得焦点文档; 页面加载,用户输入(通常由tab债券).和 调用代码focus()功能. HTML5新的属性和方法,辅助管理的重点: docu ...
- 读书笔记—CLR via C#委托和attribute
前言 这本书这几年零零散散读过两三遍了,作为经典书籍,应该重复读反复读,既然我现在开始写博了,我也准备把以前觉得经典的好书重读细读一遍,并且将笔记整理到博客中,好记性不如烂笔头,同时也在写的过程中也可 ...
- apache 提示You don't have permission to access /test.php on this server.怎样解决
把denty改成allow httpd.conf文件中. <Directory "cgi-bin"> AllowOverride None Options None O ...
- 利用Matlab生成一个网格化的三维三轴椭球面(生成直角坐标)
代码很简单,a,b,c分别为椭球的三轴轴长,a=b=c时得到的是三维球面,a=b!=c时得到的是三维椭球面,a!=b且a!=c且b!=c时得到的是三维旋转椭球面 %生成一个笛卡尔坐标系下三轴椭球表面的 ...
- 了解mongoDB存储结构
mongoDB 深入浅出一 了解mongoDB存储结构 MongoDB 深入浅出 数据逻辑结构 1 mongoDB中的文档(document) 相当于 关系性数据库的一条一条的记录 2 colle ...
- hadoop集群的搭建与配置(2)
对解压过后的文件进行从命名 把"/usr/hadoop"读权限分配给hadoop用户(非常重要) 配置完之后我们要创建一个tmp文件供以后的使用 然后对我们的hadoop进行配置文 ...
- ETHREAD APC
ETHREAD APC <寒江独钓>内核学习笔记(4) 继续学习windows 中和线程有关系的数据结构: ETHREAD.KTHREAD.TEB 1. 相关阅读材料 <window ...
- 【转】Objective-C并发编程:API和挑战
并发指的是在同一时间运行多个任务.在单核CPU的情况下,它通过分时的方式实现,如果有多个CPU可用,则是真正意义上的多个任务“并行”执行了. OS X和iOS提供了多个API支持并发编程.每个API都 ...
- ASP.NET服务器端事件利用MARQUEE实现正在处理效果
前言:ASP.NET同仁们应该都遇到过当触发一个比较耗时的服务器端事件时,页面会处在一个等待的状态(即假死状态),用户体验非常不好,很容易造成用户二次点击,造成重复提交.至于解决方案自然是有的(问go ...