MapReduce

Description

MapReduce是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（归纳）”，及他们的主要思想，都是从函数式编程语言借来的，还有从矢量编程语言借来的特性。

下面我们要实现一个词频统计的MapReduce Worker，通俗来说就是统计一段文本中各个单词出现的次数。

MapReduce包括两部分：Map任务和Reduce任务。

Map任务：给定一段文本，对于其每一个单词逐一映射为key为该单词，value为字符串"1"的键值对，并按出现顺序逐个输出键值对

Reduce任务：给定一个键值对序列，将相同的key的value值相加，并将其按key从小到大输出键值对

Note: 单词的分割标准为空格分隔

Input 第一行包括字符串task—— 代表任务类型，有Map和Reduce两种。

若为Map任务，第二行包括一行字符串text(0 < |text| <= 1e7) ——一段需要处理的文本。

若为Reduce，第二行包括整数n (0 < n <= 1e5)—— 键值对序列长度，第3到n+3行输入键值对key和value(0 <=

|key| <= 1e5, 0<=value<=1000) —— 要处理的键值对序列。有多组样例，请处理到文件结尾。

键值对格式为key value。

保证正常运算过程中int类型不溢出。

Output 对于Map任务，输出文本后中每个单词映射的键值对的key和value。

对于Reduce任务，输出排序后的键值对的key和value。键值对格式为key value。

每个样例间用空行分割。

Sample Input 1

Map

This is a MapReduce problem inspired by MapReduce

Reduce

8

This 1

is 1

a 1

MapReduce 1

problem 1

inspired 1

by 1

MapReduce 1

Sample Output 1

This 1

is 1

a 1

MapReduce 1

problem 1

inspired 1

by 1

MapReduce 1

MapReduce 2

This 1

a 1

by 1

inspired 1

is 1

problem 1

思路

用STL中的map 模拟这个过程

题解

#include<iostream>

#include<cstdio>

#include<cmath>

#include<map>

#include<algorithm>

#include<queue>

#include<string>

using namespace std;

#define ll long long

const int Len = 1e6 + 5;

int n,m;

string s[Len];

map<string, int> mp;

string st;

int main()

{

    ios::sync_with_stdio(false); cin.tie(0);

    //freopen("T.txt","r",stdin);

    while(cin >> st)

    {

        if(st == "Map")

        {

            int k = 0;

            while(cin >> s[k])

            {

                if(s[k] == "Reduce")

                {

                    cout << endl;

                    goto lab;

                }

                cout << s[k] << " " << 1 <<endl;

            }

            cout << endl;

        }

        else

        {

            mp.clear();

            lab:;

            int n;

            cin >> n;

            int val;

            for(int i = 1; i <= n; i ++)

                cin >> st >> val, mp[st] += val;

            for(auto x : mp)

            {

                cout << x.first << " " << x.second <<endl;

            }

            cout << endl;

            mp.clear();

        }

    }

    return 0;

}

MapReduce（ map的使用）的更多相关文章

关于mapreduce.map.java.opts
a) Update the property in relevant mapred-site.xml(from where client load the config). b) Import t ...
mapreduce map 的个数
在map阶段读取数据前,FileInputFormat会将输入文件分割成split.split的个数决定了map的个数.影响map个数(split个数)的主要因素有: 1) 文件的大小.当块(dfs. ...
MapReduce Map数 reduce数设置
JobConf.setNumMapTasks(n)是有意义的,结合block size会具体影响到map任务的个数,详见FileInputFormat.getSplits源码.假设没有设置mapred ...
MapReduce: map读取文件的过程
我们的输入文件 hello0, 内容如下: xiaowang 28 shanghai@_@zhangsan 38 beijing@_@someone 100 unknown 逻辑上有3条记录, 它们以 ...
MapReduce 图解流程超详细解答(1)-【map阶段】
转自:http://www.open-open.com/lib/view/open1453097241308.html 在MapReduce中,一个YARN 应用被称作一个job, MapReduc ...
MapReduce启动的Map/Reduce子任务简要分析
对于Hadoop来说,是通过在DataNode中启动Map/Reduce java进程的方式来实现分布式计算处理的,那么就从源码层简要分析一下hadoop中启动Map/Reduce任务的过程. ...
MapReduce源码分析之Task中关于对应TaskAttempt存储Map方案的一些思考
我们知道,MapReduce有三层调度模型,即Job——>Task——>TaskAttempt,并且: 1.通常一个Job存在多个Task,这些Task总共有Map Task和Redcue ...
MapReduce 图解流程超详细解答(2)-【map阶段】
接上一篇讲解:http://blog.csdn.net/mrcharles/article/details/50465626 map任务:溢写阶段正如我们在执行阶段看到的一样,map会使用Mappe ...
MongoDB聚合运算之mapReduce函数的使用（11）
mapReduce 随着"大数据"概念而流行. 其实mapReduce的概念非常简单, 从功能上说,相当于RDBMS的 group 操作 mapReduce的真正强项在哪? 答:在 ...
MapReduce剖析笔记之二：Job提交的过程
上一节以WordCount分析了MapReduce的基本执行流程,但并没有从框架上进行分析,这一部分工作在后续慢慢补充.这一节,先剖析一下作业提交过程. 在分析之前,我们先进行一下粗略的思考,如果要我 ...

随机推荐

第四章、深入理解vue组件
4-1.使用组件的细节 a.使用is解决html出现bug 如下 table下面应该为tr,所以页面渲染的时候没有找到tr是有问题的,所以是有小bug,所以table中必须是tr b.改上面bug,t ...
vue 带参数的跳转-完成一个功能之后之后需要深思，否则还会忘记
我要写详细点,否则下次很容易忘记写了一个页面,这个页面里面添加了很多a 标签,跳转都是同一个页面,内容不一样,方法首先路由设定好 routes:[ { path:'/aaa', name:' ...
NSFileHandle的用法（用于读写文件）
利用NSFilehandle类提供的方法,允许更有效地使用文件. 一般而言,处理文件时都要经历以下三个步骤: 1.打开文件,并获取一个NSFileHandle对象,以便在后面的I/O操作中引用该文件 ...
AX2012/D365 SSRS报表开发
大家好,好久没有做SSRS报表了,近期刚好有做2张,就整理起来供初学者参考. AX中SSRS报表开发的框架,父类非常多,这里跟大家简单分享2种比较常用的场景供大家使用. 1.简单的过滤字段,无特殊过滤 ...
简单配置Vue路由
简单配置Vue路由 1. 创建一个单文件组件Test.vue <template> <div>Test</div> </template> <s ...
python常用软件包
redis数据库: 链接:https://pan.baidu.com/s/1X_ndCj0scF2WZd2FPLRKag 提取码:e3zm git安装包: 链接:https://pan.baidu.c ...
【Python】2.12学习笔记变量
变量关于变量我有一个不能理解的,关于全局变量作用域与地址的问题,学函数的时候我可能会搞懂它并且写下来另外,其实昨天说的是有些不准确的,\(Python\)里的变量不是不用声明类型,只是声明方式特殊 ...
json 的基础入门
JSON是什么: JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.在初始的项目开发中人们更倾向于使用xml来进行数据的传输,但当JSON出现后,开发者更倾 ...
网络安全从入门到精通（第一章-2）快速自建web安全测试环境
本文内容动态语言常见服务器脚本动态语言可以做什么? 常见服务器环境快捷搭建软件快速的搭网站的环境 CMS 1,动态语言:是对服务器行为的编程,这被称为服务器端脚本或服务器脚本. 2,常见服务器 ...
给 ABP vNext 应用安装私信模块
在上一节五分钟完成 ABP vNext 通讯录 App 开发中,我们用完成了通讯录 App 的基础开发. 这本章节,我们会给通讯录 App 安装私信模块,使不同用户能够通过相互发送消息,并接收新私信 ...

MapReduce（ map的使用）

MapReduce

思路

题解

MapReduce（ map的使用）的更多相关文章

随机推荐

热门专题