啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

传奇的博客 2024-10-29 13:15:24 原文

伪分布式模式等同于完全分布式，只是她只有一个节点。

一） HDFS上运行MapReduce 程序

（1）配置集群

　　（a）配置：hadoop-env.sh

　　　　Linux系统中获取jdk的安装路径：

　　　　修改JAVA_HOME 路径：

　　（b）配置：core-site.xml

　　　　原始该文件内容

　　　　配置后该文件内容

　　（c）配置：hdfs-site.xml

　　　　该文件原始内容

　　　　配置后该文件内容

（2）启动集群

　　（a）格式化namenode（第一次启动时格式化，以后就不要总格式化）

　　（b）启动namenode

　　（c）启动datanode

（3）查看集群

　　（a）查看是否启动成功

　　（b）查看产生的log日志

　　（c）web端查看HDFS文件系统

　　　　在浏览器中输入 http://192.168.47.101:50070/

　　　　至此一个Hadoop的伪分布模式即搭建完成

（4）操作集群

　　（a）在hdfs文件系统上创建一个input文件夹

　　　　进入Web查看是否创建成功

　　（b）将测试文件内容上传到文件系统上

　　（c）查看上传的文件是否正确

　　（d）在Hdfs上运行mapreduce程序

　　（e）查看输出结果

　　　　命令行查看：

　　　　浏览器查看

　　（f）将测试文件内容下载到本地

　　　　点击上一步浏览器查看中的part-r-00000

　　　　将 part-r-00000文件下载后查看

　　（g）删除输出结果

二） YARN上运行MapReduce 程序

（1）配置集群

　　（a）配置yarn-env.sh

　　　　配置JAVA_HOME

　　（b）配置yarn-site.xml

　　　　增加两个属性节点

　　（c）配置：mapred-env.sh

配置JAVA_HOME

　　（d）配置： (对mapred-site.xml.template重新命名为) mapred-site.xml

并配置相应节点

（2）启动集群

启动集群之前先要保证namenode和datanode正常启动

　　（a）启动resourcemanager

　　（b）启动nodemanager

（3）集群操作

　　（a）yarn的浏览器页面查看

启动成功后在浏览器中输入对应地址可查看

　　（b）执行mapreduce程序

　　（c）查看运行结果

　　（d）删除文件系统上的output文件

三）修改本地临时文件存储目录

1）停止进程

按照resourcemanager/nodemanager->datanode/namenode的先后顺停止进程

2）修改hadoop.tmp.dir

hadoop默认生成的dfs等文件放在 /tmp/hadoop-{hostname} 下的当重启后系统临时文件夹中内容被清除，因此需要重新配置临时文件夹

在hadoop-2.7.2中新建 data/tmp 文件夹

后修改 core-site.xml，增加属性节点

3）格式化NameNode

4）启动所有进程

按照 namenode/datanode->resourcemanager/nodemanager顺序启动

5）查看/opt/module/hadoop-2.7.2/data/tmp这个目录下的内容

啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式的更多相关文章

啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式
Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...
Hadoop Single Node Setup（hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3）
Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...
啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态
一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...
3 hadoop安装Standalone模式和伪分布式模式
1 Standalone模式默认模式,即默认配置即是standalone模式装好hadoop-client,会将依赖的包安装好yum install hadoop-client配置文件各个配置文件在/ ...
Hadoop的单机模式、伪分布式模式和完全分布式模式
1.单机(非分布式)模式这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统. 2.伪分布式运行模式这种模式也是在一台单机上运行,但用不同的Java进程模仿分布式运行中 ...
啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建
一.新增一个普通用户bigdata
网站用户行为分析——Hadoop的安装与配置（单机和伪分布式）
Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...
云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop
一．实验目的 1. 掌握Linux虚拟机的安装方法. 2. 掌握Hadoop的伪分布式安装方法. 二．实验内容 (一)Linux基本操作命令 Linux常用基本命令包括: ls,cd,mkdir,rm ...
[Hadoop] Hadoop学习笔记之Hadoop基础
1 Hadoop是什么? Google公司发表了两篇论文:一篇论文是“The Google File System”,介绍如何实现分布式地存储海量数据:另一篇论文是“Mapreduce:Simplif ...

随机推荐

Linux创建删除文件和文件夹
要想删除和创建,需要有root权限 [xwg@bogon ~]$ su root密码:[root@bogon xwg]# cd /home/a 切换到目录a[root@bogon a]# t ...
elastic search&logstash&kibana 学习历程（四）kibana安装部署和使用
kibana在linux上的部署安装运行环境是centos7 基于jdk8 下载安装包:wget https://artifacts.elastic.co/downloads/kibana/kiba ...
hashcode(),equal()方法经典分析
首先,想要明白hashCode的作用,必须要先知道Java中的集合. 总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set. 前者集合内的元素是有序的,元素可以重 ...
java随机生成6位随机数 5位随机数 4位随机数
随机数,应用会相当广,验证数,订单号,流水号拼接. 下面是java随机数生成语句: 生成6位随机数(不会是5位或者7位,仅只有6位): System.+)*)); 同理,生成5位随机数: System ...
java线程基础方法详解
一.线程状态转换 1.新建状态(New):新创建了一个线程对象. 2.就绪状态(Runnable):线程对象创建后,其他线程调用了该对象的start()方法.该状态的线程位于可运行线程池中,变得可运行 ...
sql语句中where 1=1和 0=1 的作用
sql where 1=1和 0=1 的作用 where 1=1; 这个条件始终为True,在不定数量查询条件情况下,1=1可以很方便的规范语句. 一.不用where 1=1 在多条件查询中的 ...
react 闲谈
从事前端一段时间了,公司用的框架都是vue,但是不知为何对react却情有独钟,这是不是所谓的吃着碗里的看着锅里的哈哈哈从头好好总结下react吧小白一个大神勿喷瞎说一 react是由两部分 ...
提高组刷题营 DAY 1 下午
DFS 深度优先搜索通过搜索得到一棵树形图策略:只要能发现没走过的点,就走到它.有多个点可走就随便挑一个,如果无路可走就回退,再看有没有没走过的点可走. 在图上寻找路径[少数可用最短路解决]:最短 ...
[CDH] Acquire data: Flume and Kafka
Flume 基本概念一.是什么 Ref: http://flume.apache.org/ 数据源获取:Flume.Google Refine.Needlebase.ScraperWiki.Bloo ...
LVS系列三、LVS集群-IP-TUN模式
一.LVS-IP TUN集群概述 DR方式是通过MAC,规模是一个交换网络.而TUN方式,是通过给数据包加上新的IP头部来实现,这个可以跨整个广域网.TUN模式可以解决DR模式下不能跨网段的问题,甚至 ...