Big Data（八）MapReduce的搭建和初步使用

---恢复内容开始---

回顾:

1.最终开发MR的计算程序

2.hadoop 2.x 出现了一个yarn:资源管理>>MR没有后台场服务

　　yarn模型:container 容器，里面会运行我们的AppMaster，map/reduce Task

　　解耦

　　mapreduce on yarn

　　架构:RM NM

搭建:

　　RM要和NN岔开，NM个数要和DN一样

　　　　　　　　　　　　　　　　　　　　搭建图

----------通过官网：

mapred-site.xml > mapreduce on yarn

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

yarn-site.xml

//shuffle 洗牌 M -shuffle> R

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.resourcemanager.ha.enabled</name>

<value>true</value>

</property>

<property>

<name>yarn.resourcemanager.zk-address</name>

<value>node02:,node03:,node04:</value>

</property>

<property>

<name>yarn.resourcemanager.cluster-id</name>

<value>mashibing</value>

</property>

<property>

<name>yarn.resourcemanager.ha.rm-ids</name>

<value>rm1,rm2</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>node03</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>node04</value>

</property>

流程：
我hdfs等所有的都用root来操作的
node01：

cd $HADOOP_HOME/etc/hadoop

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

vi yarn-site.xml

scp mapred-site.xml yarn-site.xml node02:`pwd`

scp mapred-site.xml yarn-site.xml node03:`pwd`

scp mapred-site.xml yarn-site.xml node04:`pwd`

vi slaves //可以不用管，搭建hdfs时候已经改过了。。。

start-yarn.sh

node03~:

yarn-daemon.sh start resourcemanager

http://node03:8088

http://node04:8088

This is standby RM. Redirecting to the current active RM: http://node03:8088/

-------MR 官方案例使用：wc
实战：MR ON YARN 的运行方式：

hdfs dfs -mkdir -p /data/wc/input

hdfs dfs -D dfs.blocksize= -put data.txt /data/wc/input

cd $HADOOP_HOME

cd share/hadoop/mapreduce

hadoop jar hadoop-mapreduce-examples-2.6..jar wordcount /data/wc/input /data/wc/output

1)webui:
2)cli:

hdfs dfs -ls /data/wc/output

-rw-r--r--  root supergroup  -- : /data/wc/output/_SUCCESS //标志成功的文件

-rw-r--r--  root supergroup  -- : /data/wc/output/part-r- //数据文件

part-r-

part-m-

r/m : map+reduce r / map m

hdfs dfs -cat /data/wc/output/part-r-

hdfs dfs -get /data/wc/output/part-r- ./

抛出一个问题：
data.txt 上传会切割成2个block 计算完，发现数据是对的~！~？后边注意听源码分析~！~~

Big Data（八）MapReduce的搭建和初步使用的更多相关文章

Spring学习笔记--环境搭建和初步理解IOC
Spring框架是一个轻量级的框架,不依赖容器就能够运行,像重量级的框架EJB框架就必须运行在JBoss等支持EJB的容器中,核心思想是IOC,AOP,Spring能够协同Struts,hiberna ...
Android开发利器之Data Binding Compiler V2 —— 搭建Android MVVM完全体的基础
原创声明: 该文章为原创文章,未经博主同意严禁转载. 前言: Android常用的架构有:MVC.MVP.MVVM,而MVVM是唯一一个官方提供支持组件的架构,我们可以通过Android lifecy ...
【Big Data - Hadoop - MapReduce】通过腾讯shuffle部署对shuffle过程进行详解
摘要: 通过腾讯shuffle部署对shuffle过程进行详解摘要:腾讯分布式数据仓库基于开源软件Hadoop和Hive进行构建,TDW计算引擎包括两部分:MapReduce和Spark,两者内部都 ...
Redis总结（八）如何搭建高可用的Redis集群
以前总结Redis 的一些基本的安装和使用,大家可以这这里查看Redis 系列文章:https://www.cnblogs.com/zhangweizhong/category/771056.html ...
Kubernetes 系列（八）：搭建EFK日志收集系统
Kubernetes 中比较流行的日志收集解决方案是 Elasticsearch.Fluentd 和 Kibana(EFK)技术栈,也是官方现在比较推荐的一种方案. Elasticsearch 是一个 ...
SpringCloud微服务实战——搭建企业级开发框架（三十八）：搭建ELK日志采集与分析系统
一套好的日志分析系统可以详细记录系统的运行情况,方便我们定位分析系统性能瓶颈.查找定位系统问题.上一篇说明了日志的多种业务场景以及日志记录的实现方式,那么日志记录下来,相关人员就需要对日志数据进行 ...
android开发教程（八）——环境搭建之java-ndk
目录 android ndk是android用于开发本地代码的开发工具包.它提供C/C++交叉编译工具.android内核.驱动.已有的C/C++代码,都需要ndk来支持开发. 目前支持以下平台:ar ...
mybatis框架搭建学习初步
mybatis框架搭建步骤:1. 拷贝jar到lib目录下,而且添加到工程中2. 创建mybatis-config.xml文件,配置数据库连接信息 <environments default=& ...
【Big Data - Hadoop - MapReduce】hadoop 学习笔记：MapReduce框架详解
开始聊MapReduce,MapReduce是Hadoop的计算框架,我学Hadoop是从Hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...

随机推荐

vue-微信浏览器左上角返回按钮拦截
[需求] 在微信公众号开发中,有时需要对浏览器左上角返回按钮进行拦截处理相关的页面逻辑,而并不是让页面直接返回上一页,之前在这个细节点上的一直实现得不是很好.但看到京东购物公众号上的效果却实现得非常好 ...
IDEA创建maven各种原型项目汇总
1: internal -> appfuse-basic-jsf (创建一个基于Hibernate,Spring和JSF的Web应用程序的原型) 2: internal -> appfus ...
Python之输入输出
python中变量的输出 # 打印提示 print('hello world') print('你好!') # 输出变量 url = 'loaderman' print('我是:',url) prin ...
GIS开源程序收集
每一个项目包含以下信息: 名称主题分类描述开始时间语言许可演示网址项目网址成熟度活跃度评价分类包括:GIS基础函数库.GIS控件.GIS桌面程序.GIS数据引擎.WEBGI ...
Python的22个编程技巧，请收下！
1. 原地交换两个数字 Python 提供了一个直观的在一行代码中赋值与交换(变量值)的方法,请参见下面的示例: x,y= 10,20 print(x,y) x,y= y,x print(x,y) # ...
使用ssh-agent管理私钥
使用ssh-agent的好处: 如果有多台远程服务器与多个私钥文件,ssh-gent将会尝试使用不同的私钥文件建立连接,直至成功假如有 A.B.C 三台服务器,A是控制节点,A可以直接登录B,但是无 ...
APP自动化测试，判断页面与预期是否相同
自动化测试中,有时需要验证页面跳转是否正常 1.选择appium实现,因为要填写appPcakage和appActivity,只能验证一个单独的APP,在自身APP上各个页面是否跳转正常例如:焦点从 ...
【HANA系列】SAP 【第一篇】EXCEL连接SAP HANA的方法（ODBC）
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列]SAP [第一篇]EXCEL连接 ...
kh67-wjs
个人简历基本信息姓名: 性别: 年龄: 籍贯: 联 ...
tensorflow-2.0 技巧 | ImageNet 归一化
_MEAN_RGB = [123.15, 115.90, 103.06] def _preprocess_subtract_imagenet_mean(inputs): ""&qu ...

Big Data（八）MapReduce的搭建和初步使用

回顾:

搭建:

Big Data（八）MapReduce的搭建和初步使用的更多相关文章

随机推荐

热门专题