Hadoop 下载 (2.9.2)

准备工作

关闭防火墙 (也可放行)

# 停止防火墙

systemctl stop firewalld

# 关闭防火墙开机自启动

systemctl disable firewalld

修改 hosts 文件，让 hadoop 对应本机 IP 地址 (非 127.0.0.1)

vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::         localhost localhost.localdomain localhost6 localhost6.localdomain6

xxx.xxx.xxx.xxx    hadoop

安装 JDK

https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

# 解压

tar -zxf /opt/jdk-8u202-linux-x64.tar.gz -C /opt/

# 配置环境变量

vim /etc/profile

# JAVA_HOME

export JAVA_HOME=/opt/jdk1..0_202/

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$CLASSPATH

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

# 刷新环境变量

source /etc/profile

# 验证

java -version

# java version "1.8.0_202"

# Java(TM) SE Runtime Environment (build 1.8.0_202-b08)

# Java HotSpot(TM) -Bit Server VM (build 25.202-b08, mixed mode)

安装Hadoop

# 解压

tar -zxf /opt/hadoop-2.9.-snappy-.tar.gz -C /opt/

# 配置环境变量

vim /etc/profile

# HADOOP_HOME

export HADOOP_HOME=/opt/hadoop-2.9.

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

# 刷新环境变量

source /etc/profile

# 验证

hadoop version

# 自己编译的，显示可能不一样

# Hadoop 2.9.

# Subversion Unknown -r Unknown

# Compiled by root on --16T09:39Z

# Compiled with protoc 2.5.

# From source with checksum 3a9939967262218aa556c684d107985

# This command was run using /opt/hadoop-2.9./share/hadoop/common/hadoop-common-2.9..jar

配置 Hadoop 伪分布式

一、配置 HDFS

hadoop-env.sh

vim /opt/hadoop-2.9./etc/hadoop/hadoop-env.sh

# 配置 JDK 路径

# The java implementation to use.

export JAVA_HOME=/opt/jdk1..0_202/

core-site.xml

<configuration>

    <!-- 指定HDFS中NameNode的地址 -->

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://hadoop:9000</value>

    </property>

    <!-- 指定Hadoop运行时产生文件的存储目录 -->

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/hadoopTmp</value>

    </property>

</configuration>

hdfs-site.xml

<configuration>

    <!-- 指定HDFS副本的数量 -->

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <!-- 默认为true，namenode 连接 datanode 时会进行 host 解析查询 -->

    <property>

        <name>dfs.namenode.datanode.registration.ip-hostname-check</name>

        <value>true</value>

    </property>

</configuration>

启动 hdfs

# 第一次使用需要先格式化一次。之前若格式化过请先停止进程，然后删除文件再执行格式化操作

hdfs namenode -format

# 启动 namenode

hadoop-daemon.sh start namenode

# 启动 datanode

hadoop-daemon.sh start datanode

# 验证，查看 jvm 进程

jps

#  Jps

#  NameNode

#  DataNode

浏览器访问 CentOS 的 IP 地址加端口号 (默认50070) 即可看到 web 端

二、配置 YARN

yarn-env.sh

vim /opt/hadoop-2.9./etc/hadoop/yarn-env.sh

# 配置 JDK 路径

# some Java parameters

export JAVA_HOME=/opt/jdk1..0_202/

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

    <!-- Reducer获取数据的方式 -->

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

    <!-- 指定YARN的ResourceManager的地址 -->

    <property>

        <name>yarn.resourcemanager.hostname</name>

        <value>hadoop</value>

    </property>

</configuration>

启动 yarn，需保证 hdfs 已启动

# 启动 resourcemanager

yarn-daemon.sh start resourcemanager

# 启动 nodemanager

yarn-daemon.sh start nodemanager

# 查看 JVM 进程

jps

#  DataNode

#  ResourceManager

#  Jps

#  NameNode

#  NodeManager

浏览器访问 CentOS 的 IP 地址加端口号 (默认8088) 即可看到 web 端

三、配置 MapReduce

mapred-env.sh

vim /opt/hadoop-2.9./etc/hadoop/mapred-env.sh

# 配置 JDK 路径

export JAVA_HOME=/opt/jdk1..0_202/

# when HADOOP_JOB_HISTORYSERVER_HEAPSIZE is not defined, set it.

mapred-site.xml

# 复制一份

cp /opt/hadoop-2.9./etc/hadoop/mapred-site.xml.template /opt/hadoop-2.9./etc/hadoop/mapred-site.xml

# 编辑

vim /opt/hadoop-2.9./etc/hadoop/mapred-site.xml

<configuration>

    <!-- 指定MR运行在YARN上 -->

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

运行一个 MapReduce 任务

# 计算圆周率

hadoop jar /opt/hadoop-2.9./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9..jar pi  

# Job Finished in 26.542 seconds

# Estimated value of Pi is 3.14800000000000000000

浏览器访问 CentOS 的 IP 地址加端口号 (默认8088) 可以查看记录

其他配置

四、配置 jobhistory，打开历史记录

mapred-site.xml

<configuration>

    <!-- 历史服务器端地址 -->

    <property>

        <name>mapreduce.jobhistory.address</name>

        <value>hadoop:10020</value>

    </property>

    <!-- 历史服务器web端地址 -->

    <property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>hadoop:19888</value>

    </property>

    <property>

        <name>yarn.log.server.url</name>

        <value>http://hadoop:19888/jobhistory/logs</value>

    </property>

</configuration>

# 启动 jobhistory

mr-jobhistory-daemon.sh start historyserver

# JVM 进程

jps

#  NodeManager

#  DataNode

#  Jps

#  NameNode

#  ResourceManager

#  JobHistoryServer

浏览器访问 CentOS 的 IP 地址加端口号 (默认19888) 即可看到 web 端

五、配置 log-aggregation，打开日志聚集，在 web 端可以查看运行详情

yarn-site.xml

<configuration>

    <!-- 开启日志聚集功能 -->

    <property>

        <name>yarn.log-aggregation-enable</name>

        <value>true</value>

    </property>

    <!-- 设置日志保留时间(7天) -->

    <property>

        <name>yarn.log-aggregation.retain-seconds</name>

        <value>604800</value>

    </property>

</configuration>

# 需要重启一遍服务

hadoop-daemon.sh stop namenode

hadoop-daemon.sh stop datanode

yarn-daemon.sh stop resourcemanager

yarn-daemon.sh stop nodemanager

mr-jobhistory-daemon.sh stop historyserver

hadoop-daemon.sh start namenode

hadoop-daemon.sh start datanode

yarn-daemon.sh start resourcemanager

yarn-daemon.sh start nodemanager

mr-jobhistory-daemon.sh start historyserver

# 再运行一个任务，就可以看到详情

hadoop jar /opt/hadoop-2.9./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9..jar pi

查看刚刚运行的任务详情，未开启日志聚集之前运行的任务无法查看详情

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html

CentOS7 下 Hadoop 单节点(伪分布式)部署的更多相关文章

Win10环境下Hadoop(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)
一.本文思路 [1].配置java环境–JDK12(Hadoop的底层实现语言是java,hadoop运行需要JDK环境) [2].安装Hadoop 1.解压hadop 2.配置hadoop环境变量 ...
吴裕雄--天生自然HADOOP操作实验学习笔记：单节点伪分布式安装
实验目的了解java的安装配置学习配置对自己节点的免密码登陆了解hdfs的配置和相关命令了解yarn的配置实验原理 1.Hadoop安装 Hadoop的安装对一个初学者来说是一个很头疼的事情 ...
kafka系列一：单节点伪分布式集群搭建
Kafka集群搭建分为单节点的伪分布式集群和多节点的分布式集群两种,首先来看一下单节点伪分布式集群安装.单节点伪分布式集群是指集群由一台ZooKeeper服务器和一台Kafka broker服务器组成 ...
ubantu18.04下Hadoop安装与伪分布式配置
1 下载下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/stable2/ 2 解压将文件解压到 /usr/local/hadoop cd ~ ...
Hadoop单节点启动分布式伪集群
emm~ 写这篇博客只是手痒,因为开发环境用单节点就够了,生产环境肯定是真实集群,所以这个伪分布式纯属娱乐而已. 配置HDFS1. 安装好一台hadoop,可以参考这篇博客.2. 在hadoop目录下 ...
单节点伪分布式Hadoop配置
本文所用软件版本: VMware-workstation-full-11.1.0 jdk-6u45-linux-i586.bin ubuntukylin-14.04-desktop-i386.iso ...
Hbase入门教程--单节点伪分布式模式的安装与使用
Hbase入门简介 HBase是一个分布式的.面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像 ...
【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】
1.规划好哪些服务运行在那个服务器上需要配置的配置文件 2. 修改配置文件,设置服务运行机器节点首先在 hadoop-senior 的这台主机上进行解压 hadoop2.5 按照 ...
CentOS7下Hadoop伪分布式环境搭建
CentOS7下Hadoop伪分布式环境搭建前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...

随机推荐

PHP——emjoin表情存入数据库
前言还有一种解决的方法是更改数据库,这里就不写了,这里直接对emoji进行转码代码 mb_strlen() | strlen() | rawurlencode() | rawurldecode() ...
P1387 最大正方形 dp
思路: i j的最大正方形等于min(他的斜上方的的最大正方形,他的上方有的连续1,他的左方有的连续1)+1 #include<bits/stdc++.h> using namespac ...
洛谷P1007独木桥题解
题目这个题看起来很难,但是只要理解了题目,一切都显得简单. 你只需想象出来每个人在碰撞之后仅仅是交换了灵魂, 这样一来,代码就好写了. 附代码: #include<iostream> # ...
springMVC整理03--处理数据模型 & 试图解析器 & @ResponseBody & HttpEntity
1.处理模型数据 SpringMVC 中的模型数据是非常重要的,因为 MVC 中的控制(C)请求处理业务逻辑来生成数据模型(M),而视图(V)就是为了渲染数据模型的数据.当有一个查询的请求,控制器(C ...
BZOJ 4196 软件包管理器
树链剖分建树之后,安装软件就是让跟节点到安装的节点路径所有点权+1,卸载软件就是让一个节点和他的子数-1 要求变化数量的话直接求和相减就行啦(绝对值) 注意一点,一开始的lazyatag应该是-1, ...
用随机投掷飞镖法计算Pi值（Randomness Throwing dart Pi Python）
画一个边长为r的正方形和半径为r的四分之一的圆(如下图所示),向上面随机投掷飞镖,通过计算落在星星区域和整体区域的飞镖比例,即可求出π值. 公式推导如下: 假设正方形的边长r为1,那么飞镖落在星星区域 ...
CCF WC2017 & THU WC2017 旅游记
day-x 真·旅游去了杭州的一些景点,打了几场练习赛. day0 报到日领资料.入住,中午在食堂吃饭,感觉做的挺好的,和二高食堂差不多.晚上还有开幕式. day1~day4 白天讲课,晚上营员交 ...
Nginx反向代理服务器
安装Nginxyum -y install nginx 修改并添加配置文件vi /etc/nginx/nginx.conf在HTTP模块中添加: client_header_timeout 3000; ...
css元素溢出
当子元素的尺寸超过父元素的尺寸时,需要设置父元素显示溢出的子元素的方式,设置的方法是通过overflow属性来设置. overflow的设置项: 1.visible 默认值.内容不会被修剪,会呈现在元 ...
[2017-7-26]Android Learning Day4
RecycleView 恩,学习Fragment的过程中的一个小实践居然用到了RecycleView!坑了我好久有木有!!好气哦,从昨晚到现在.(现在也还是一头雾水,不过照搬也会用了) 这是第一版的代 ...

CentOS7 下 Hadoop 单节点(伪分布式)部署