Hadoop的伪分布式搭建

我们在搭建伪分布式Hadoop环境，需要将一系列的配置文件配置好。
一、配置文件
1. 配置文件hadoop-env.sh
export JAVA_HOME=/opt/modules/jdk1.7.0_67
2. 配置core-site.xml

dfs.defaultFS
hdfs://hostname:8020

hadoop.tmp.dir
/opt/modules/hadoop-2.5.0/data/tmp

配置hdfs-site.xml

dfs.replication
3
配置yarn-site.xml

yarn.nodemanager.aux-services
mapreduce_shuffle
配置mapred-site.xml

mapreduce.framework.name
yarn

二、启动HDFS
1，格式化NameNode
bin/hdfs namenode -format
2，启动NameNode
bin/hadoop.daemon.sh start namenode
3，启动DataNode
bin/hadoop.daemon.sh start datanode
4，HDFS的WEB监控页面：
http://hostname:50070
5，启动SecondaryNameNode
bin/hadoop.daemon.sh start secondarynamenode
6，SecondaryNameNode的WEB监控页面：
http://hostname:50090

三、日志文件
启动每个守护进程会产生两个log文件，文件路径为$HADOOP_HOME/logs目录下，文件的格式为【.log】和【.out】
.log：log4j记录，记录大部分应用程序的日志信息
.out：记录标准输出和标准错误日志，少量记录
日志的命名规则：【框架名+用户名+进程名+主机名+日志格式】

四、启动YARN
1，启动ResourceManager
bin/yarn-daemon.sh start resourcemanager
2，启动NodeManager
bin/yarn-daemon.sh start nodemanager
3，YARN的WEB监控界面：
http://hostname:8088 resourcemanager
http”//hostname:8042 nodemanager

五、历史服务器
1，启动历史服务器
bin/mr-jobhistory-daemon.sh start historyserver
2，历史服务器监控界面
http://hostname:19888

Hadoop的伪分布式搭建的更多相关文章

大数据hadoop的伪分布式搭建
1.配置环境变量JDK配置 1.JDK安装个人喜欢在 vi ~/.bash profile 下配置 export JAVA_HOME=/home/hadoop/app/jdk1.8.0_91ex ...
Hadoop简介与伪分布式搭建—DAY01
一. Hadoop的一些相关概念及思想 1.hadoop的核心组成: (1)hdfs分布式文件系统 (2)mapreduce 分布式批处理运算框架 (3)yarn 分布式资源调度系统 2.hadoo ...
超详细解说Hadoop伪分布式搭建--实战验证【转】
超详细解说Hadoop伪分布式搭建原文http://www.tuicool.com/articles/NBvMv2原原文 http://wojiaobaoshanyinong.iteye.com/b ...
2.hadoop基本配置,本地模式,伪分布式搭建
2. Hadoop三种集群方式 1. 三种集群方式本地模式 hdfs dfs -ls / 不需要启动任何进程伪分布式所有进程跑在一个机器上完全分布式每个机器运行不同的进程 2. 服务器基本配 ...
使用IDEA远程向伪分布式搭建的Hadoop提交MapReduce作业
环境 VirtualBox 6.1 IntelliJ IDEA 2020.1.1 Ubuntu-18.04.4-live-server-amd64 jdk-8u251-linux-x64 hadoop ...
spark1.6.0伪分布式搭建
环境: hadoop2.6.0 jdk1.8 ubuntu 14.04 64位 1 安装scala环境版本是scala-2.10.6,官网下载地址http://www.scala-lang.org/ ...
[b0006] Spark 2.0.1 伪分布式搭建练手
环境: 已经安装好: hadoop 2.6.4 yarn 参考: [b0001] 伪分布式 hadoop 2.6.4 准备: spark-2.0.1-bin-hadoop2.6.tgz 下载地址: ...
bayaim_hadoop1_2.2.0伪分布式搭建
------------------bayaim_hadoop1_2.2.0伪分布式搭建_2018年11月06日09:21:46--------------------------------- 1. ...
hadoop2.8 集群 1 （伪分布式搭建）
简介: 关于完整分布式请参考: hadoop2.8 ha 集群搭建 [七台机器的集群] Hadoop:(hadoop2.8) Hadoop是一个由Apache基金会所开发的分布式系统基础架构.用户 ...

随机推荐

bzoj3165 1568
1568是3165的弱化版,发的代码是3165的这道题完全没想出来,是看wyl大神的题解http://hi.baidu.com/wyl8899/item/2deafd3a376ef2d46d15e99 ...
ASP.NET 導入Excel
常常碰到這種需求,為了避免自己每次寫Code都要東翻西找Sample,乾脆丟上來當備份此外,也為了方便網路上的大大們Copy Paste方便,小弟已經順便標示要複製程式碼的起始結束位置在歡樂的貼程 ...
Linux Kernel本地权限提升漏洞
漏洞版本: Linux Kernel 漏洞描述: Bugtraq ID:64291 CVE ID:CVE-2013-6368 Linux Kernel是一款开源的操作系统. 如果用户空间提供的vapi ...
【 D3.js 选择集与数据详解 — 1 】使用datum()绑定数据
选择集和数据的关系是 D3 最重要的基础,在[入门 - 第 7 章]时进行过些许讲解,对于要掌握好 D3 是远远不够的.故此开设一个新的分类,专门讨论选择集与数据的关系,包括数据绑定的使用和工作原理, ...
iframe 处理
import java.io.File; import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org ...
【原】实战-Java如何使用Redis
实战-Java如何使用Redis Redis的Client支持的语言非常丰富,如下: ActionScript Bash C C# C++ Clojure Common Lisp Crystal D ...
[九度OJ]1011.最大连续子序列
原题链接:http://ac.jobdu.com/problem.php?pid=1011 题目描述: 给定K个整数的序列{ N1, N2, ..., NK },其任意连续子序列可表示为{ N ...
oracle 中v$sqlarea,v$sql,v$session,gv$session，远程连接等问题
一.分析 (1)使用 least recently used (LRU) algorithm 来管理的,不用的自动踢出,可以使用keep 将需要的语句保存在 library cache中. 所以应该 ...
C辗转相除法求最大公约数的实现
int gcd(int a, int b)//求最大公约数,a为分子,b为分母 { ) return a; return gcd(b,a%b); }
算法导论学习-RED-BLACK TREE
1. 红黑树(RED-BLACK TREE)引言: ------------------------------------- 红黑树(RBT)可以说是binary-search tree的非严格的平 ...

Hadoop的伪分布式搭建

Hadoop的伪分布式搭建的更多相关文章

随机推荐

热门专题