利用MapReduce计算平均数

利用mapreduce求出股票价格的开盘和收盘平均数

下图为采集到的股票信息，共计1416支股票的信息

因为在linux系统下默认采用utf-8的编码格式，而在win下txt默认采用ANSI编码格式。所以需要在linux下将文件转换一下格式，可以采用：

递归转换(包括子文件夹)

find default -type d -exec mkdir -p utf/{} \;

find default -type f -exec iconv -f GBK -t UTF-8 {} -o utf/{} \;

这两行命令将default目录下的文件由GBK编码转换为UTF-8编码，目录结构不变，转码后的文件保存在utf/default目录下。

package economic;
import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.FloatWritable;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class ScoreAvgTest {
/**
*
* @author hadoop www.ysgj1688.com KEYIN：输入map的key值，为每行文本的开始位置子字节计算，（0,11...）
* VALUEIN：输入map的value，为每行文本值 KEYOUT ：输出的key值 VALUEOUT：输出的value值
*/
public static class MapperClass extends Mapper<Object, Text, Text, Text> {
private Text companyName = new Text();
private Text open = new Text();
private Text data=new Text();
private int n = 0;
@Override
protected void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
// TODO Auto-generated method stub
System.out.println(this.n);
n++;
String lineText = value.toString();
String[] args = lineText.split("\\s+");
if (args.length == 4) {
this.companyName.set(args[1]);
}
if (args.length == 7) {
try {
System.out.println("Bfter Reducer:" + companyName + ","
+ args[1]);
data.set(args[1]+" "+args[4]);
context.write(this.companyName, data);
} catch (IOException e) {
e.printStackTrace(www.vboyl130.cn);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
/**
*
* @author hadoop KEYIN:输入的名字 VALUEIN：输入的分数 KEYOUT：输出的名字 VALUEOUT：统计输出的平均分
*/
public static class ReducerClass extends Reducer<Text, Text, Text, Text> {
private Text text = new Text();
protected void reduce(Text companyName, Iterable<Text> kaipan,
Context context) throws IOException, InterruptedException {
// TODO Auto-generated method stub
double sumOpen = 0.0;
double sumClose = 0.0;
int num = 0;
Iterator<Text> $it = kaipan.iterator();
while ($it.hasNext())www.vboyule.cn {
String record = $it.next(www.baohuayule.net ).toString();
String[] getData=record.split(" ");
System.out.println(num);
System.out.println("原始数据：" + record);
num++;
System.out.println("第" www.qinlinyule.cn + num + "次循环");
sumOpen += (Double.valueOf(getData[0])*100);
sumClose+=(Double.valueOf(getData[1])*100);
}
double openPrise = sumOpen / (100 * num);
double closePrise = sumClose / (100 * num);
System.out.println("openPrice1:" + openPrise);
System.out.println("www.120xh.cn closePrice1:" + closePrise);
openPrise = (double) Math.round(openPrise * 100) / 100;
closePrise = (double) Math.round(closePrise * 100) / 100;
System.out.println("sumOpen:" + sumOpen+" sumClose"+sumClose);
System.out.println("openPrice2:" + openPrise);
System.out.println("closePrice2:" + closePrise);
String result ="开盘平均价："+Double.toString(openPrise)+", 收盘平均价："+Double.toString(closePrise);
text.set(result);
try {
context.write(companyName, text);
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) throws IOException,
InterruptedException, www.255055.cn/ ClassNotFoundException {
Configuration conf = new Configuration();
conf.set("fs.default.name", "hdfs://localhost:9000");
String[] otherArgs = new String[] { "export", "output" }; //export为文本输入路径，output为输出路径
if (otherArgs.length < 2) {
System.err.println("Usage:wordcount<in>[<in>...]<out>");
System.exit(2);
}
Job job = Job.getInstance(conf, "arg");
job.setJarByClass(ScoreAvgTest.class);
job.setMapperClass(MapperClass.class);
// job.setCombinerClass(ReducerClass.class);
System.out.println("Mapper over");
job.setReducerClass(ReducerClass.class);
System.out.println("Reducer over");
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

运行后生成的output文件夹中的文件

利用MapReduce计算平均数的更多相关文章

Hadoop阅读笔记（二）——利用MapReduce求平均数和去重
前言:圣诞节来了,我怎么能虚度光阴呢?!依稀记得,那一年,大家互赠贺卡,短短几行字,字字融化在心里:那一年,大家在水果市场,寻找那些最能代表自己心意的苹果香蕉梨,摸着冰冷的水果外皮,内心早已滚烫.这一 ...
MapReduce计算模型的优化
MapReduce 计算模型的优化涉及了方方面面的内容,但是主要集中在两个方面:一是计算性能方面的优化:二是I/O操作方面的优化.这其中,又包含六个方面的内容. 1.任务调度任务调度是Hadoop中 ...
（第4篇）hadoop之魂--mapreduce计算框架，让收集的数据产生价值
摘要: 通过前面的学习,大家已经了解了HDFS文件系统.有了数据,下一步就要分析计算这些数据,产生价值.接下来我们介绍Mapreduce计算框架,学习数据是怎样被利用的. 博主福利给大家赠送一套ha ...
Hadoop 中利用 mapreduce 读写 mysql 数据
Hadoop 中利用 mapreduce 读写 mysql 数据有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...
使用mapreduce计算环比的实例
最近做了一个小的mapreduce程序,主要目的是计算环比值最高的前5名,本来打算使用spark计算,可是本人目前spark还只是简单看了下,因此就先改用mapreduce计算了,今天和大家分享下这个 ...
利用sklearn计算文本相似性
利用sklearn计算文本相似性,并将文本之间的相似度矩阵保存到文件当中.这里提取文本TF-IDF特征值进行文本的相似性计算. #!/usr/bin/python # -*- coding: utf- ...
MapReduce计算模型
MapReduce计算模型 MapReduce两个重要角色:JobTracker和TaskTracker. MapReduce Job 每个任务初始化一个Job,没个Job划分为两个阶段:Map和 ...
MapReduce——计算温度最大值（基于全新2.2.0API）
MapReduce——计算温度最大值 (基于全新2.2.0API) deprecated: Job类的所有Constructors, 新的API用静态方法getInstance(conf)来去的Job ...
hadoop笔记之MapReduce的应用案例(利用MapReduce进行排序)
MapReduce的应用案例(利用MapReduce进行排序) MapReduce的应用案例(利用MapReduce进行排序) 思路: Reduce之后直接进行结果合并具体样例: 程序名:Sort. ...

随机推荐

C# 委托知识总结【转】
1.什么是委托,为什么要使用委托我正在埋头苦写程序,突然想喝水,但是又不想自己去掉杯水而打断自己的思路,于是我就想让女朋友去给我倒水.她去给我倒水,首先我得让她知道我想让她干什么,通知她之后我可以继 ...
mysql 数据库设计规范
MySQL数据库设计规范目录 1. 规范背景与目的 2. 设计规范 2.1 数据库设计 2.1.1 库名 2.1.2 表结构 2.1.3 列数据类型优化 2.1.4 索引设计 2.1.5 分库分表. ...
Apache Maven（一）：快速入门
Maven 是什么? Maven 是一个项目管理和整合工具.Maven 为开发者提供了一套完整的构建生命周期框架.开发团队几乎不用花多少时间就能够自动完成工程的基础构建配置,因为 Maven 使用了一 ...
【yii2】 yii框架如果控制器和方法都是多个单词组成应该怎样写请求链接
最近的一个项目碰到这种问题,摸索出了解决办法,故此记录下 example 如果控制器为 ShopCollect 方法为 UserList solution 请求的链接应该为 doman.com/sho ...
git重新下载项目
file-new-project from version control - git 修改网址为需要的网址
正则表达式，regular expression, regex, RE
正则表达式是用来简洁表达一组字符串的表达式正则表达式可以用来判断某字符串的特征归属
TouTiao开源项目分析笔记10 实现通用普通文章片段页面
1.RxJava的Observable数据操作符总结 1.1.Map操作符 Map操作符对原始Observable发射的没一项数据应用一个你选择的函数, 然后返回一个发射这些结果的Observable ...
[bzoj3196][tyvj1728]普通平衡树
真是太差了,到现在才打出一个平衡树的板子.. 感谢blackjack大佬提供的数组版treap板子!!基本完全照搬,blackjack太神啦! 但目前我只会这几个最基本的操作(说白了STL的(mult ...
Hibernate---架构
Hibernate 架构是分层的,作为数据访问层,你不必知道底层 API .Hibernate 利用数据库以及配置数据来为应用程序提供持续性服务(以及持续性对象). 下面是一个非常高水平的 Hiber ...
bootstrap设计横线上加字
1.给横线上加字 . 2.思路:通过z-index实现,可以将父元素的z-index设置成2,而横线的z-index设置成-1,这样有字的地方就可以覆盖横线,再设置字的padding达到合理的宽度 ( ...

利用MapReduce计算平均数

利用MapReduce计算平均数的更多相关文章

随机推荐

热门专题