一、分布式HDFS的安装和启动

①在$HADOOP_HOME/etc/hadoop/core-site.xml文件

<configuration>

<property>

  <name>fs.defaultFS</name>

  <!-- 告知NN在哪个机器，NN使用哪个端口号接收客户端和DN的RPC请求. -->

  <value>hdfs://主机名:9000</value>

</property>

<property>

  <name>hadoop.tmp.dir</name>

  <value>/opt/module/hadoop-2.7.2/data/tmp</value>

</property>

</configuration>

②格式化Namenode（只需要格式化一次）

命令：hadoop namenode -format

目的： ①生成/opt/module/hadoop-2.7.2/data/tmp目录

②在目录中生成fsimage_0000000000000000000文件

③启动Namenode

hadoop-daemon.sh start namenode

启动datanode

hadoop-daemon.sh start datanode

④查看

Jps

通过浏览器访问 http://nn所在的主机名或ip:50070

如果NN和DN都在一台机器，且只有一个DN节点，称为伪分布式！

二、在YARN上运行MR

①修改 $HADOOP_HOME/etc/hadoop/mapred-site.xml文件

<property>

  <name>mapreduce.framework.name</name>

  <value>yarn</value>

</property>

②启动YARN

配置RM到底在哪个机器启动

修改 $HADOOP_HOME/etc/hadoop/yarn-site.xml文件

<property>

<name>yarn.resourcemanager.hostname</name>

<value>主机名</value>

</property>

<!-- reducer获取数据的方式 -->

<property>

 		<name>yarn.nodemanager.aux-services</name>

 		<value>mapreduce_shuffle</value>

</property>

③启动RM,NM

yarn-daemon.sh start resourcemanager

yarn-daemon.sh start nodemanager

④查看

jps

http://RM所运行的机器主机名/ip:8088

三、提交任务

hadoop jar jar包主类名参数{多个输入目录，一个输出目录}

输入目录中必须全部是文件！

输出目录必须不存在！

HDFS和MR的配置和使用的更多相关文章

高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南
原文:http://my.oschina.net/wstone/blog/365010#OSC_h3_13 (WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南 [X] ...
Hadoop HDFS安装、环境配置
hadoop安装进入Xftp将hadoop-2.7.3.tar.gz 复制到自己的虚拟机系统下的放软件的地方,我的是/soft/software 在虚拟机系统装软件文件里,进行解压缩并重命名进入p ...
CM记录-Hadoop 分布式文件系统HDFS（登录、配置、监控）
1.登录(浏览器输入ip地址:7180,登录用户名和登录密码即可) 2.CM主界面(各个组件,监控图表,绿色代表运行正常.黄色代表运行不良,需要关注根据实际情况调整,红色代表故障,需要排查问题) 3. ...
HDFS 的垃圾回收配置
HDFS的垃圾回收的默认配置的 0,也就是说,如果你不小心误删除了某样东西,那么这个操作是不可恢复的. 但是如果配置了HDFS的垃圾回收机制,那么删除的东西就可以在垃圾箱中保存一段你配置的时间,等 ...
HDFS Federation客户端(viewfs)配置攻略
转自:http://dongxicheng.org/hadoop-hdfs/hdfs-federation-viewfs/ 1. HDFS Federation产生背景在Hadoop 1.0中,HD ...
一梳理从 HDFS 到 MR。
MapReduce 不仅仅是一个工具,更是一个框架.我们必须拿问题解决方案去适配框架的 map 和 reduce 过程很多情况下,需要关注 MapReduce 作业所需要的系统资源,尤其是集 ...
Hadoop框架：HDFS高可用环境配置
本文源码:GitHub·点这里 || GitEE·点这里一.HDFS高可用 1.基础描述在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Sta ...
can not create symbolic link HDFS解压自动配置lib报错。
如题,使用FusionInsight解压生成样例代码的时候报错,找不到解释.只猜测是权限问题.然后并没有仔细静心思考,心里杂念很多,很浮躁. 解决方法是“以管理员身份运行“. 想想高中:面对问题,不能 ...
Lucene搜索引擎+HDFS+MR完成垂直搜索
介于上一篇的java实现网络爬虫基础之上,这一篇的思想是将网络收集的数据保存到HDFS和数据库(Mysql)中:然后用MR对HDFS的数据进行索引处理,处理成倒排索引:搜索时先用HDFS建立好的索引来 ...

随机推荐

PAT 在霍格沃茨找零钱
如果你是哈利·波特迷,你会知道魔法世界有它自己的货币系统 —— 就如海格告诉哈利的:“十七个银西可(Sickle)兑一个加隆(Galleon),二十九个纳特(Knut)兑一个西可,很容易.”现在,给定 ...
温故知新-快速理解zookeeper功能&应用&选举机制
文章目录 zookeeper简介什么是zookeeper zookeeper应用场景 zookeeper特点 zookeeper的角色 zookeeper的数据模型节点数据结构节点类型 zook ...
React、Vue添加全局的请求进度条（nprogress）
全局的请求进度条,我们可以使用nprogress来实现,效果如下: 首先需要安装插件: npm i nprogress -S 然后使用的时候主要有两种方式,第一种是切换页面的时候,第二种则是请求接口的 ...
实验三 Linux系统用户管理及VIM配置
项目内容这个作业属于哪个课程班级课程的主页链接这个作业的要求在哪里作业要求链接接地址学号-姓名 17041428-朱槐健作业学习目标 1.学习Linux系统用户管理 2.学习vim使用 ...
Spark Streaming，Flink，Storm，Kafka Streams，Samza：如何选择流处理框架
根据最新的统计显示,仅在过去的两年中,当今世界上90%的数据都是在新产生的,每天创建2.5万亿字节的数据,并且随着新设备,传感器和技术的出现,数据增长速度可能会进一步加快. 从技术上讲,这意味着我们的 ...
intput子系统
1.按键驱动程序的第一个版本:day07/04 //内核模块的基本要求 init.h module.h LICENSE struct cdev btn_cdev; b ...
使用nodejs的puppeteer库爬取瓜子二手车网站
const puppeteer = require('puppeteer'); (async () => { const fs = require("fs"); const ...
APP——python——自动化环境搭建01
前提:python以及pycharm安装完成. ---------------------------------------------------------------------------- ...
大众点评cat实时监控简介及部署
简介背景 CAT(Central Application Tracking)是由吴其敏(前大众点评首席架构师,现携程架构负责人)主导设计基于Java开发打造的实时应用监控平台,为大众点评网提供了全面 ...
Java 重写hashCode()与equals()
为什么要重写hashCode() 和 equals() equals() 默认的Object类里面equals()方法是根据对象所在的内存来做判断的,如果两个对象引用指向的是同一个内存,则返回true ...

HDFS和MR的配置和使用

一、分布式HDFS的安装和启动

二、在YARN上运行MR

HDFS和MR的配置和使用的更多相关文章

随机推荐

热门专题