搭建Hadoop平台(新手入门)

刚刚大学毕业,接触大数据有一年的时间了,把自己的一些学习笔记分享给大家,希望同热爱大数据的伙伴们一起学习,成长!

资料准备:

　　Hadoop-2.7.1下载:http://pan.baidu.com/s/1o7LKaSU 密码:64du

　　Jdk下载(文中使用1.7,这里给得1.8,不影响使用):http://pan.baidu.com/s/1kVEEJ91 密码:r22t

安装步骤：

0.关闭防火墙

执行：service iptables stop 这个指令关闭完防火墙后，如果重启，防火墙会重新建立，所以，如果想重启后防火墙还关闭，需额外执行：chkconfig iptables off

1.配置主机名

执行： vim /etc/sysconfig/network

编辑主机名

注意：主机名里不能有下滑线，或者特殊字符#$，不然会找不到主机导致无法启动

这种方式更改主机名需要重启才能永久生效，因为主机名属于内核参数。

如果不想重启，可以执行：hostname hadoop01。但是这种更改是临时的，重启后会恢复原主机名。

所以可以结合使用。先修改配置文件，然后执行:hostname hadoop01 。可以达到不重启或重启都是主机名都是同一个的目的

2.配置hosts文件

执行：vim /etc/hosts（192.168.161.41是我自己机器的ip，这里必须写入自己本机的ip）

3.配置免秘钥登录

在hadoop01节点执行(执行过hostname hadoop01)：

执行：ssh-keygen

然后一直回车，直到出现类似的图形：

生成节点的公钥和私钥，生成的文件会自动放在/root/.ssh目录下

然后把公钥发往远程机器，比如hadoop01向hadoop02发送

执行：ssh-copy-id root@hadoop01

此时，hadoop02节点就是把收到的hadoop秘钥保存在

/root/.ssh/authorized_keys 这个文件里，这个文件相当于访问白名单，凡是在此白明白存储的秘钥对应的机器，登录时都是免密码登录的。

当hadoop01再次通过ssh远程登录hadoop02时，发现不需要输入密码了。

在hadoop02节点执行上述上述步骤，让hadoop02节点连接hadoop01免密码登录

4.配置自己节点登录的免密码登录

如果是单机的伪分布式环境，节点需要登录自己节点，即hadoop01要登录hadoop01

但是此时是需要输入密码的，所以要在hadoop01节点上

执行：ssh-copy-id root@hadoop01（上面已经给出）

5.安装和配置jdk

1）安装jdk

mkdir /usr/local/src/java

rz 上传jdk tar包

tar -xvf jdk-7u51-linux-x64.tar.gz

配置环境变量

1：vi /etc/profile

2：在尾行添加

#set java environment

JAVA_HOME=/usr/local/src/java/jdk1.7.0_51

JAVA_BIN=/usr/local/src/java/jdk1.7.0_51/bin

PATH=$JAVA_HOME/bin:$PATH

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME JAVA_BIN PATH CLASSPATH

保存退出

3：source /etc/profile 使更改的配置立即生效

4：java -version 查看JDK版本信息。如显示1.7.0证明成功。

执行： vi /etc/profile

2）在尾行添加

#set java environment

JAVA_HOME=/usr/local/src/java/jdk1.7.0_51

PATH=$JAVA_HOME/bin:$PATH

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOMEPATH CLASSPATH

保存退出

3）source /etc/profile 使更改的配置立即生效

4）java -version 查看JDK版本信息。如显示1.7.0证明成功。

6.上传和解压hadoop安装包

执行：tar -xvf hadoop……(包名)

目录说明：

bin目录：命令脚本

etc/hadoop:存放hadoop的配置文件

lib目录：hadoop运行的依赖jar包

sbin目录：启动和关闭hadoop等命令都在这里

libexec目录：存放的也是hadoop命令，但一般不常用

最常用的就是bin和etc目录

7.配置hadoop-env.sh

这个文件里写的是hadoop的环境变量,主要修改hadoop的java_home路径

切换到 etc/hadoop(cd etc/hadoop)目录

执行：vim hadoop-env.sh

修改java_home路径和hadoop_conf_dir 路径(自己本机的安装目录)

然后执行：source hadoop-env.sh 让配置立即生效

8.修改core-site.xml

在 etc/hadoop 目录下

执行：vim core-site.xml

配置如下：

<name>fs.default.name</name>

<value>hdfs://hadoop01:9000<value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/soft/hadoop-2.7.1/tmp</value>

</property>

</configuration>

9.修改vim hdfs-site .xml

配置如下：

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

10.修改vim mapred-site.xml

这个文件初始时是没有的，有的是模板文件，mapred-site.xml.template

所以需要拷贝一份，并重命名为mapred-site.xml

执行：cp mapred-site.xml.template mapred-site.xml

配置如下：

<name>mapreduce.framework.name</name>

</property>

</configuration>

yarn是资源协调工具，

11.修改vim yarn-site.xml

配置如下：

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

12.配置vim slaves文件

13.配置hadoop的环境变量

配置代码：vim /etc/profile

HADOOP_HOME=/usr/soft/hadoop-2.7.1JAVA_HOME=/usr/local/src/java/jdk1.7.0_51

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export JAVA_HOME PATH CLASSPATH HADOOP_HOME

14.格式化namenode

为什么要格式化?

执行：hadoop namenode -format

如果不好使，可以重启linux

当出现：successfully，证明格式化成功

15.启动Hadoop

cd hadoop-2.7.1/sbin (进入hadoop安装目录后执行)

./start-dfs.sh或者sh start-dfs.sh

16.停止Hadoop

./stop-dfs.sh 或者sh stop-dfs.sh

注：如果在启动时，报错：Cannot find configuration directory: /etc/hadoop

解决办法：

编辑etc/hadoop下的hadoop-env.sh 文件，添加如下配置信息：

export HADOOP_CONF_DIR=/home/software/hadoop-2.7.1/etc/hadoop

然后执行source hadoop-env.sh 使配置立即生效

执行：start-yarn.sh 启动yarn相关的服务

在浏览器访问：

192.168.161.41:50070 来访问 hadoop 的管理页面(必须是自己本机的ip)

大家若感兴趣,转载本文,请注明出处

搭建Hadoop平台(新手入门)的更多相关文章

大数据Hadoop学习之搭建hadoop平台（2.2）
关于大数据,一看就懂,一懂就懵. 一.概述本文介绍如何搭建hadoop分布式集群环境,前面文章已经介绍了如何搭建hadoop单机环境和伪分布式环境,如需要,请参看:大数据Hadoop学习之搭建had ...
大数据Hadoop学习之搭建Hadoop平台（2.1）
关于大数据,一看就懂,一懂就懵. 一.简介 Hadoop的平台搭建,设置为三种搭建方式,第一种是"单节点安装",这种安装方式最为简单,但是并没有展示出Hadoop的技术优势,适合 ...
Windows 10 搭建Hadoop平台
一.环境配置 JDK:1.8. Hadoop下载地址(我选择的是2.7.6版本):https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ ...
ubuntu下搭建hadoop平台
终于把单击模式跟伪分布式模式搭建起来了,记录于此. 1.SSH无密码验证配置因为伪分布模式下DataNode和NameNode均是本身,所以必须配置SSH localhost的无密码验证. 第一步, ...
使用ambari搭建Hadoop平台
1.操作系统 CentoOS Server with GUI(有GUI,有浏览器*ambari基于浏览器*推荐latest stable version)2.分区默认 + /hadoop3.网络设置 ...
hadoop平台搭建
前言这是小的第一次搭建hadoop平台,写下这篇博客有以下几个目的(ps:本博只记录在linux系统下搭建hadoop的步骤,如果需要了解在其他平台上搭建hadoop的步骤,还请移步): 1.希望大 ...
安卓自动化测试（2）Robotium环境搭建与新手入门教程
Robotium环境搭建与新手入门教程准备工具:Robotium资料下载知识准备: java基础知识,如基本的数据结构.语法结构.类.继承等对Android系统较为熟悉,了解四大组件,会编写简单 ...
【HADOOP】| 环境搭建：从零开始搭建hadoop大数据平台（单机/伪分布式）-下
因篇幅过长,故分为两节,上节主要说明hadoop运行环境和必须的基础软件,包括VMware虚拟机软件的说明安装.Xmanager5管理软件以及CentOS操作系统的安装和基本网络配置.具体请参看: [ ...
高可用Hadoop平台－HBase集群搭建
1.概述今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建单点问题验证截 ...

随机推荐

java课程设计——博客作业教学数据分析系统（201521123083 戴志斌）
目录一.团队课程设计博客链接二.个人负责模块或任务说明三.自己的代码提交记录截图四.自己负责模块或任务详细说明五.课程设计感想 (题外话,终于可以用markdown建目录) 一.团队课程设计 ...
【Beta】Daily Scrum Meeting——Day7
站立式会议照片 1.本次会议为第七次Meeting会议: 2.本次会议在中午12点,在陆大楼召开,本次会议为30分钟讨论今天要完成的任务以及接下来的任务安排. 燃尽图每个人的工作分配成员昨天已 ...
线程高级篇-读写锁ReentrantReadWriteLock
转载原文:http://blog.csdn.net/john8169/article/details/53228016 读写锁: 分为读锁和写锁,多个读锁不互斥,读锁和写锁互斥,这是有JVM自己控制的 ...
201521123003《Java程序设计》第8周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结集合与泛型相关内容. 2. 书面作业本次作业题集集合 1.List中指定元素的删除(题目4-1) 1.1 实验总结我们利用Sca ...
java程序设计-算术表达式的运算
1.团队课程设计博客链接洪亚文博客链接:http://www.cnblogs.com/201521123065hyw/ 郑晓丽博客链接:http://www.cnblogs.com/zxl3066/ ...
在linux下通过hexdump生成一个十六进制的文本保存文件，解析此文件转变成正常源代码文件。
举例说明: 此十六进制保存的文件为此源代码hexdump生成的: #include<stdio.h> #include<string.h> #include<stdlib ...
搭建连接MySql的三层架构的ASP.NetCore2.0的WebApi
里我们用三层架构搭建一个连接MySql的ASP.netCore模板的WebApi项目首先添加WebApi项目(ASP.NetCore版本) 右键解决方案>新建项目> 选择Web>A ...
pygame 精灵的行走及二段跳实现方法
不得不承认<Python游戏编程入门>这本书翻译.排版非常之烂,但是里面的demo还是很好的,之前做了些改编放到这里. 先是素材: 背景精灵所有素材均取自此书接下来就是精灵类的创建了 ...
纳税服务系统【抽取BaseService、条件查询】
抽取BaseService 到目前为止,我们已经写了三个模块的开发了.我们已经抽取过了BaseAction.BaseDao,我们这次来看看我们的Service接口. UserService /** * ...
Activiti-01
1, Activiti官网:http://www.activiti.org/ 主页可以看到jar包的下载. 2, 进入http://www.activiti.org/userguide/index. ...

搭建Hadoop平台(新手入门)

配置环境变量

搭建Hadoop平台(新手入门)的更多相关文章

随机推荐

热门专题