3 weekend110的shuffle机制 + mr程序的组件全貌

前面，讲到了hadoop的序列化机制，mr程序开发，自定义排序，自定义分组。

有多少个reduce的并发任务数可以控制，但有多少个map的并发任务数还没

缓存，分组，排序，转发，这些都是mr的shuffle。

Soga

现在。来观察map阶段有几个yarnchild，reduce阶段有几个yarnchild。对应地，就是有多少个map的并发任务数，有多少个reduce的并发任务数

以上我，查看有多少个map并发任务数

查看map并发任务数之后，进程被回收。

查看reduce并发任务数

Reduce的Task进程被回收

总的来说，

生成个Runjar -> 生成个MRAppMaster（运行map任务） -> 查看map并发任务数 ->

Map的Task进程被回收 ->查看reduce并发任务数 -> Reduce的Task进程被回收 –>

以上是/flow/data

其实啊，前面，讲到了hadoop的序列化机制，mr程序开发，自定义排序，自定义分组。

有多少个reduce的并发任务数可以控制，但有多少个map的并发任务数还没（是在分片中控制的）。

下面，来将在/flow/data中，分片控制map的并发任务数

Soga，原来是如此

缓存，分组，排序，转发，这些都是mr的shuffle。

Soga

以上是weekend110的shufle机制，部分在前面都讲了。

下面是weekend110的mr程序的组件全貌

往数据库、HBase、ftp、hdfs（默认是往hdfs写），文件，，，用户不用管，特推出mr程序的组件------OutputFormat

比如，对于图片，视频，，，这些，InputFormat，就不能了。

可以看到，DBInputFormat是去数据库里读，

可以看到，DBOutputFormat是往数据库里写，

这里，只是想看下InputFormat和OutputFormat

恢复

3 weekend110的shuffle机制 + mr程序的组件全貌的更多相关文章

3 weekend110的job提交的逻辑及YARN框架的技术机制 + MR程序的几种提交运行模式
途径1: 途径2: 途径3: 成功! 由此,可以好好比较下,途径1和途径2 和途径3 的区别. 现在,来玩玩weekend110的joba提交的逻辑之源码跟踪原来如此,weekend110的job提 ...
1 weekend110的复习 + hadoop中的序列化机制 + 流量求和mr程序开发
以上是,weekend110的yarn的job提交流程源码分析的复习总结下面呢,来讲weekend110的hadoop中的序列化机制 1363157985066 13726230503 ...
Hadoop MapReduce概念学习系列之mr程序组件全貌（二十）
其实啊,spilt是,控制Apache Hadoop Mapreduce的map并发任务数,详细见http://www.cnblogs.com/zlslch/p/5713652.html map,是m ...
2 weekend110的hadoop的自定义排序实现 + mr程序中自定义分组的实现
我想得到按流量来排序,而且还是倒序,怎么达到实现呢? 达到下面这种效果, 默认是根据key来排, 我想根据value里的某个排, 解决思路:将value里的某个,放到key里去,然后来排下面,开始w ...
2 weekend110的mapreduce介绍及wordcount + wordcount的编写和提交集群运行 + mr程序的本地运行模式
把我们的简单运算逻辑,很方便地扩展到海量数据的场景下,分布式运算. Map作一些,数据的局部处理和打散工作. Reduce作一些,数据的汇总工作. 这是之前的,weekend110的hdfs输入流之源 ...
【Spark】Spark的Shuffle机制
MapReduce中的Shuffle 在MapReduce框架中,shuffle是连接Map和Reduce之间的桥梁,Map的输出要用到Reduce中必须经过shuffle这个环节,shuffle的性 ...
MapReduce实例2（自定义compare、partition）& shuffle机制
MapReduce实例2(自定义compare.partition)& shuffle机制实例:统计流量有一份流量数据,结构是:时间戳.手机号.....上行流量.下行流量,需求是统计每个用 ...
Shuffle 机制
1. 概述 Map 方法之后,Reduce 方法之前的数据处理过程称之为 Shuffle. 2. Partition 分区需求:要求将统计结果按照条件输出到不同文件中(分区).比如:将统计结果按照手 ...
Hadoop_18_MapRduce 内部的shuffle机制
1.Mapreduce的shuffle机制: Mapreduce中,map阶段处理的数据如何传递给Reduce阶段,是mapreduce框架中最关键的一个流程,这个流程就叫shuffle 将mapta ...

随机推荐

AMAZON PRICE TRACKER, AMAZON PRICE HISTORY, AMAZON PRICE DROP ALERT | DROPGG.COM
DropGG.com is the destination for savvy shoppers looking to save money by buying smart. DropGG.com a ...
如何用angularjs制作一个完整的表格之三__在ng-repeat中使用ng-model
在ng-repeat中使用ng-model时会有许多问,有的人碰到无法获取绑定的数据内容,有的人遇到改动绑定的数据内容时所有循环生成的内容一起改变.上面的问题我在开发时也遇到过,但是解决后我却怎么也还 ...
如何利用C生成.so供Mono调用
Mono诞生的初衷是为了吸引更多的Windows .Net程序员来加入Linux平台的开发.但在Linux世界中C语言依然是主流.很多时候一些关键应用(比如大型笛卡儿乘积运算.需要调用平台硬件功 ...
Unity给力插件之MegaFiers
这是一个关于网格变形的插件.其中有非常多的功能. 这是它的API地址:http://www.west-racing.com/mf/ 花了2天的时间实践并整理了其中绝大多数的功能,只有一些关于特殊格式的 ...
JS简单仿QQ聊天工具的制作
刚接触JS,对其充满了好奇,利用刚学到的一点知识,写了一个简单的仿QQ聊天的东西,其中还有很多的不足之处,有待慢慢提高. 功能:1.在输入框中输入内容,点击发送,即可在上方显示所输入内容. 2.点击‘ ...
SEVERE: Error listenerStart
转载:http://blog.sina.com.cn/s/blog_43eb83b90102e2k6.html# 今天启动Tomcat启动不了,报以下错:org.apache.catalina.cor ...
记录一次配置unix网络编程环境的过程和遇到的问题
记录一次搭建unix网络编程环境过程中遇到的问题和总结计算机环境虚拟机 linuxmint-18-xfce-64bit 1.打开unix网络编程.iso 把目录下的文件复制到某一目录,修改权限,可命 ...
在C#里实现各种窗口切换特效，多达13种特效
原文:http://www.cnblogs.com/clayui/archive/2011/06/28/2092126.html 预览: 下载这次clayui给大家带来了比较实用的东西,因为时间 ...
textarea宽度、高度自动适应处理方法
textarea自动高度 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http: ...
CAS单点登录配置[3]：服务器端配置
在准备工作,证书生成等工作完成后,本篇介绍服务器端的配置. JDK配置 1 我们将生成的cacerts文件分别拷贝到JDK目录下的jre/lib/security目录下及JRE对应的目录中,如果之前存 ...

3 weekend110的shuffle机制 + mr程序的组件全貌

3 weekend110的shuffle机制 + mr程序的组件全貌的更多相关文章

随机推荐

热门专题