Hadoop集群搭建

1.修改/etc/hosts文件

在每台linux机器上，sudo vim /etc/hosts 编写hosts文件。将主机名和ip地址的映射填写进去。编辑完后，结果如下：

2.配置ssh，实现无密码登录

四台虚拟机上，使用： ssh-keygen -t rsa 一路回车就行了

master上将公钥放到authorized_keys里。命令：:

sudo cat id_rsa.pub >> authorized_keys

将master上的authorized_keys放到其他linux的~/.ssh目录下。

sudo scp authorized_keys cjpt@132.228.28.183:~/.ssh

修改authorized_keys权限，命令：chmod 644 authorized_keys

测试是否成功

ssh cjpt@132.228.28.183

输入用户名密码，然后退出，再次ssh hostbb不用密码，直接进入系统。这就表示成功了

3.上传jdk，并配置环境变量

下载java，解压缩放到/usr/lib/jvm路径下

在.bash_profile文件添加环境变量，vim ~/.bash_profile：

export JAVA_HOME=/usr/lib/jvm/jdk1..0_60

export JRE_HOME=/usr/lib/jvm/jdk1..0_60/jre

source ~/.bash_profile，使配置生效

4.上传hadoop，并配置hadoop

4.1. 下载hadoop包，解压缩到本地路径

4.2. 修改环境变量，将hadoop加进去

vim ~/.bashrc

export HADOOP_PREFIX=/home/cjpt/hadoop-2.2.0.2.0.6.-

export HADOOP_HOME=/home/cjpt/hadoop-2.2.0.2.0.6.-

export PATH=$HADOOP_HOME/bin:$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

4.3. 修改hadoop/etc/hadoop/下面的配置文件

hadoop-env.sh

注意：JAVA_HOME必须是绝对路径，不然会报错

core-site.xml

hdfs-site.xml，

mapred-site.xml，

master，

slave，

上面的hadoop-env.sh，core-site.xml，mapred-site.xml，hdfs-site.xml，master，slave几个文件，在四台linux中都是一样的。

配置完一台电脑后，可以将hadoop包，直接拷贝到其他电脑上。

4.4. 让hadoop配置生效

source hadoop-env.sh

4.5. 格式化namenode，只格式一次

hadoop namenode –format

4.6. 启动hadoop

切到hadoop/sbin目录下，执行 start-all.sh启动所有程序

./start-all.sh

4.7. 查看进程，是否启动

jps

master主机：

slave机器：

大数据 --> Hadoop集群搭建的更多相关文章

大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
大数据 -- Hadoop集群环境搭建
首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...
[转]大数据hadoop集群硬件选择
问题导读 1.哪些情况会遇到io受限制? 2.哪些情况会遇到cpu受限制? 3.如何选择机器配置类型? 4.为数据节点/任务追踪器提供的推荐哪些规格? 随着Apache Hadoop的起步,云客户 ...
大数据——Hadoop集群坏境CentOS安装
前言前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...
大数据 --> Kafka集群搭建
Kafka集群搭建下面是以三台机器搭建为例,(扩展到4台以上一样,修改下配置文件即可) 1.下载kafka http://apache.fayea.com/kafka/0.9.0.1/ ,拷贝到三台 ...
王雅超的学习笔记-大数据hadoop集群部署（十）
Spark集群安装部署
大数据hadoop集群部署（一）
环境系统配置 JAVA虚拟机的安装
王雅超的学习笔记-大数据hadoop集群部署（七）
MySQL的安装部署
大数据初级笔记二：Hadoop入门之Hadoop集群搭建
Hadoop集群搭建把环境全部准备好,包括编程环境. JDK安装版本要求: 强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术 ...

随机推荐

实战DeviceIoControl 之五：列举已安装的存储设备
Q 前几次我们讨论的都是设备名比较清楚的情况,有了设备名(路径),就可以直接调用CreateFile打开设备,进行它所支持的I/O操作了.如果事先并不能确切知道设备名,如何去访问设备呢? A 访问设备 ...
php 递归无线级别分类
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8"> <?ph ...
SQL注入攻击三部曲之入门篇
SQL注入攻击三部曲之入门篇服务器安全管理员和攻击者的战争仿佛永远没有停止的时候,针对国内网站的ASP架构的SQL注入攻击又开始大行其道.本篇文章通过SQL注入攻击原理引出SQL注入攻击的实施方法, ...
offline页面开发常用方法及页面控件验证
offline页面开发常用方法及页面控件验证,对一些CheckBoxList操作进行封装,新人可以直接使用该代码. 1.返回上一页网址 /// <summary> /// Descript ...
ACM1008
题目:Haab日历和Tzolkin日历的转换. Maya一共有两种日历,第一种日历名为Haab,将一年分为365天,一共有19个月.其中前18个月,分别命名为pop.nozip.zotz.tzec.x ...
js中的0就是false，非0就是true及案例
在处理js代码判断真假时经常会这么写. 但fun()可能得到的是数字0,这可不是表示的没有值,但是!js中的数字0就是false,非0就是true. 于是0就被无情的当做false了. 已经被这个坑过 ...
I2C总线协议的软件模拟实现方法
I2C总线协议的软件模拟实现方法在上一篇博客中已经讲过I2C总线通信协议,本文讲述I2C总线协议的软件模拟实现方法. 1. 简述所谓的I2C总线协议的软件模拟实现方法,就是用软件控制GPIO的输入 ...
springboot入门的一点基础
什么是SpringBoot java问世20年由于,发展到现在从技术角度来说已经很成熟,开发过程中我们总是在想如何去提高团队开发规范性.减少重复配置.避免低效开发.部署发布时流程的复杂度以及第三方技术 ...
【BZOJ3196】二逼平衡树（树状数组，线段树）
[BZOJ3196]二逼平衡树(树状数组,线段树) 题面 BZOJ题面题解如果不存在区间修改操作: 搞一个权值线段树区间第K大--->直接在线段树上二分某个数第几大--->查询一下 ...
【洛谷T7152】（考试题目）细胞
题面题目描述小 X 在上完生物课后对细胞的分裂产生了浓厚的兴趣.于是他决定做实验并观察细胞分裂的规律. 他选取了一种特别的细胞,每天每个该细胞可以分裂出 x − 1 个新的细胞. 小 X 决定第 ...

大数据 --> Hadoop集群搭建