MIT 6.824学习笔记1 MapReduce

本节内容：Lect 1

MapReduce框架的执行过程：

    master分发任务，把map任务和reduce任务分发下去

    map worker读取输入,进行map计算写入本地临时文件

    map任务完成通知master 告知本地中间结果文件的位置大小信息

    master通知reduce worker

    reduce worker从不同的map worker读取自己负责的部分，这个过程称为shuffle

    reduce worker读取之后会在本地进行排序

    调用用户的reduce方法进行计算

    最终reduce将结果输出到全局的文件系统(GFS)

失败处理的过程：

    master故障：不处理，外部程序决定是否重做

    worker故障：master定时ping各个worker，若一段时间ping不通说明崩了

    如果发现了某个worker故障了

        这个worker执行中的reduce和map任务都会被标记为空闲重新分配

        如果是reduce任务并且执行完了那么就忽略不管（reduce生成的结果存在GFS，不会丢）

        如果是map任务并且执行完了，那么就要重置状态，要求重新执行。因为中间文件可能丢失了（map的中间文件存在worker本地）。

具体过程可以参考这张图：

MapReduce模型的容错性：map()/reduce()各个函数之间都是独立运行的，没有依赖。所以重新执行也会产生相同的输出。纯函数的这个需求是MR相对于其他并行编程方案的主要限制，然后也是因为这个需求使得MR非常简单。当出错时直接重新执行对应的函数和区块即可

每个区块尽可能的小（分成尽可能多的块），便于负载均衡、出错重启等

Ref: https://zou.cool/2018/11/27/mapreduce/

MIT 6.824学习笔记1 MapReduce的更多相关文章

MIT 6.824学习笔记4 Lab1
现在我们准备做第一个作业Lab1啦 wjk大神也在做6.824,可以参考大神的笔记https://github.com/zzzyyyxxxmmm/MIT6824_Distribute_System P ...
MIT 6.824学习笔记2 RPC/Thread
本节内容:Lect 2 RPC and Threads 线程:Threads allow one program to (logically) execute many things at onc ...
MIT 6.824学习笔记3 Go语言并发解析
之前看过一个go语言并发的介绍:https://www.cnblogs.com/pdev/p/10936485.html 但这个太简略啦.下面看点深入的还记得https://www.cnblog ...
MIT 6.824(Spring 2020) Lab1: MapReduce 文档翻译
首发于公众号:努力学习的阿新前言大家好,这里是阿新. MIT 6.824 是麻省理工大学开设的一门关于分布式系统的明星课程,共包含四个配套实验,实验的含金量很高,十分适合作为校招生的项目经历,在文 ...
hadoop 学习笔记：mapreduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
Hadoop学习笔记：MapReduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
【Big Data - Hadoop - MapReduce】hadoop 学习笔记：MapReduce框架详解
开始聊MapReduce,MapReduce是Hadoop的计算框架,我学Hadoop是从Hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
hadoop 学习笔记：mapreduce框架详解(转)
原文:http://www.cnblogs.com/sharpxiajun/p/3151395.html(有删减) Mapreduce运行机制下面我贴出几张图,这些图都是我在百度图片里找到的比较好的 ...
Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...

随机推荐

脚本_查找 Linux 系统中的僵尸进程
#!bin/bash#功能:查找Linux系统中的僵尸进程#作者:liusingbon#使用awk判断ps命令输出的第8列为Z时,显示该进程的 PID 和进程命令ps aux |awk '{if($8 ...
Linux下NFS服务器的搭建与配置（转）
一.NFS服务简介 NFS 就是 Network FileSystem 的缩写,最早之前是由sun 这家公司所发展出来的. 它最大的功能就是可以透过网络,让不同的机器.不同的操作系统.可以彼此分享个别 ...
python字符串前面的u，还有r
以u或U开头的字符串表示unicode字符串如果你想要用非英语写文本,那么你需要有一个支持Unicode的编辑器.(了解一下unicode和ascll码还有utf-8) u'你好' # ...
LocalDateTime用法（jdk1.8 ）
前言最近看别人项目源码,发现Java8新的日期时间API很方便强大,所以转载该入门介绍博客,记录一下. 使用新时间日期API的必要性在java8以前,或许: 当你在做有关时间日期的操作时,你会想到 ...
No module named 'requests'---问题解决记录
今天在用Pycharm执行脚本时,报错.如下: 问题排查: 1,检查是否安装了requests cmd输入命令:pip install requests 提示有新版本可以升级,那我就升级了. 然后输 ...
基于MyBatis实现Dao理论
基于MyBatis实现Dao理论推荐使用xml提供sql 实现接口推荐使用Mapper自动实现DAO接口,让我们更关注sql书写本身
[CSP-S模拟测试]:reverse（数位DP）
题目描述我们定义: $\overline{d_k...d_2d_1}=\sum \limits_{i=1}^kd_i\times {10}^{i-1}=n(d_i\in [0,9]\ and\ d_ ...
hook原生打包流程
将实际执行的Transform换成了MatrixTraceTransform public static void inject(Project project, def variant) { //获 ...
（转）pycharm autopep8配置
转:https://blog.csdn.net/BobYuan888/article/details/81943808 1.pip下载安装: 在命令行下输入以下命令安装autopep8 pip ins ...
lnmp环境下 tp3.2 not found
最近将一个lamp环境下使用tp3.2 开发的项目迁移到本地了, 但是在打开项目的时候,提示 not found,经过多方面查找发现是伪静态问题,解决方法如下: 在nginx 域名配置文件我这里是[v ...

MIT 6.824学习笔记1 MapReduce

MIT 6.824学习笔记1 MapReduce的更多相关文章

随机推荐

热门专题