hadoop得知；block数据块；mapreduce实现样例；UnsupportedClassVersionError变态；该项目的源代码相关联

对于开源的东西。特别是刚出来不久。我认为最好的学习方法是能够看到源代码，doc，样品测试

为了方便查看源代码，导入与项目相关的源代码

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmVlZGthbmU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

先前的项目导入源代码是关联了源代码文件

block数据块，在配置文件hdfs-default.xml中能够查看到,记住要改动不是在这里

block文件存储块是最主要的单位

查看block存放位置，配置文件里查看

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmVlZGthbmU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

假设文件大于64M会占两个块，meta文件是校验文件，第二个文件大于64M，删除文件后，则相应block不在

datanode存放文件，一个文件能够存放在不同机器上datanode

mapreduce本身有默认的类，当什么都不写的时候，原样输出

package com.kane.mr.minidefault;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

public class TestDefault {

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

//GenericOptionsParser辅助工具类

//String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();

String[] otherArgs = {"hdfs://centos:9000/kane/mini.txt","hdfs://centos:9000/kane/output"};

if (otherArgs.length != 2) {

System.err.println("Usage: wordcount <in> <out>");

System.exit(2);

}

Job job = new Job(conf, "word count");

job.setJarByClass(TestDefault.class);

//中间的内容省略就採用默认的类操作,应该是原样输出

FileInputFormat.addInputPath(job, new Path(otherArgs[0]));//输入參数，相应hadoop jar 相应类执行时在后面加的第一个參数

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));//输出參数

System.exit(job.waitForCompletion(true) ? 0 : 1);

}

}

然后到处该类为jar包，放到hadoop文件下，执行

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmVlZGthbmU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

接下来自己创建须要mr执行的源文件，并导入hdfs中

当我们执行hadoop命令执行时可能出异常。由于你编写代码的jdk可能和hadoop用到的JVM不匹配

解决java.lang.UnsupportedClassVersionError问题

Jbuilder2006自带了1.5的JDK,但假设你还想继续用JDK1.42。假设仅仅是在Jbuilder2006的tool->configure->JDKs中加入一个JDK1.42或更低版本号，那么即使你仅仅写一个最简单的HelloWorld程序，Jbuilder2006都会给你报出长长一串错误。编写的代码在Jbuilder2005中也无法执行。JBuilder2006在执行编译project时，会针对特定版本号的VM进行编译，默认的是Java 2 SDK, v 5.0 And Late。因此。假设project用的是1.5下面的JDK，碰到都是java.lang.UnsupportedClassVersionError这个错误。

解决的办法事实上非常easy，仅仅要更改这个选项即可了。详细过程例如以下：

----------------------------------------------------------

1、右键点击project文件，选择属性(properties),

2、在属性窗体中选择 Build-->Java,在右边的选项中有四个下拉框，就能够看到编译选项了，

3、当中Compiler和Debug Option能够不用管。仅仅在Languege features和Target VM中选择对应的JDK版本号就能够了，然后确定，一切OK。

附件中是配置的图片。

-----------------------------------------------------------

假设在Target VM中选择了All Java SDKs。那么你的class文件在使用JDK1.1的VM上都能够执行（Jbuilder2006帮助中是这么说的。预计没几个人的机子上还在用JDK1.1吧 :-）

Eclipse3.1相同会出现相同的问题。这时候仅仅须要把项目用的JDK与你安装的JDK搞成版本号一样就攻克了．

步骤：右击你的项目－－＞属性－－＞Java Compiler，设置合适的版本号！

。

默认的mr程序原样输出

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmVlZGthbmU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

測试wordcount

package com.kane.mr;

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

public class MapperClass extends Mapper<Object,Text,Text,IntWritable>{

public Text keyText=new Text("key");

public IntWritable intValue=new IntWritable(1);

@Override

protected void map(Object key, Text value,

Context context)

throws IOException, InterruptedException {

//获取输入的值

String str=value.toString();

//用什么分隔键值，默认空格或\t 或\n

StringTokenizer sTokenizer=new StringTokenizer(str);

//循环输出。假如是My name is kane 则分四次输出四个单词

while (sTokenizer.hasMoreElements()) {

Object object = (Object) sTokenizer.nextElement();

//这里每一个单词能够看做一个key

keyText.set(str);

context.write(keyText, intValue);//匹配一个就加value比如（“My”，1）

}

}

}

package com.kane.mr;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Reducer;

//map传来的键值就是text 和 intwritable

public class ReducerClass extends Reducer<Text,IntWritable, Text,IntWritable>{

public IntWritable intValue= new IntWritable(0);

@Override

protected void reduce(Text key, Iterable<IntWritable> values,//假如name出现两次。这里得到的values是 name [1,1]

Context context)

throws IOException, InterruptedException {

int sum=0;

while (values.iterator().hasNext()) {

sum+=values.iterator().next().get();

}

//这里值用intwritable输出是由于非常多情况下一个mapreduce的输出是下一个mapreduce的输入

intValue.set(sum);

context.write(key, intValue);

}

}

package com.kane.mr;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

public class WordCounter {

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();

if (otherArgs.length != 2) {

System.err.println("Usage: wordcount <in> <out>");

System.exit(2);

}

Job job = new Job(conf, "word count");

job.setJarByClass(WordCounter.class);

job.setMapperClass(MapperClass.class);

//job.setCombinerClass(IntSumReducer.class);

job.setReducerClass(ReducerClass.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

FileInputFormat.addInputPath(job, new Path(otherArgs[0]));//输入參数，相应hadoop jar 相应类执行时在后面加的第一个參数

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));//输出參数

System.exit(job.waitForCompletion(true) ? 0 : 1);

}

}

hadoop得知；block数据块；mapreduce实现样例；UnsupportedClassVersionError变态；该项目的源代码相关联的更多相关文章

hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码
对于开源的东东,尤其是刚出来不久,我认为最好的学习方式就是能够看源代码和doc,測试它的样例为了方便查看源代码,关联导入源代码的项目先前的项目导入源代码是关联了源代码文件 block数据块,在配置 ...
Hadoop hadoop 之hdfs数据块修复方法
hadoop 之hdfs数据块修复方法: .手动修复 hdfs fsck / #检查集群的健康状态 hdfs debug recoverLease -path 文件位置 -retries 重试次数 # ...
Hdfs block数据块大小的设置规则
1.概述 hadoop集群中文件的存储都是以块的形式存储在hdfs中. 2.默认值从2.7.3版本开始block size的默认大小为128M,之前版本的默认值是64M. 3.如何修改block块的 ...
Android利用Volley异步载入数据完整具体演示样例(二)
MainActivity例如以下: package cc.y; import android.app.Activity; import android.content.Context; import ...
原生MapReduce开发样例
一.需求 data: 将相同名字合并为一个,并计算出平均数 tom 小明 jerry 2哈 tom tom 小明二.编码 1.导入jar包 2.编码 2.1Map编写 package com.wzy ...
HDFS读文件过程分析：读取文件的Block数据
转自http://shiyanjun.cn/archives/962.html 我们可以从java.io.InputStream类中看到,抽象出一个read方法,用来读取已经打开的InputStrea ...
jinja2的url_for 和数据块
1.静态文件引入:{{ url_for('static', filename='文件路径') }} 2.定义路由:{{ url_for('模块名.视图名',变量=参数) }} 3.定义数据块: ...
Hadoop0.20.2 Bloom filter应用演示样例
1. 简单介绍參见<Hadoop in Action>P102 以及 <Hadoop实战(第2版)>(陆嘉恒)P69 2. 案例网上大部分的说明不过依照<Hadoop ...
通过Canvas及File API缩放并上传图片完整演示样例
创建一个只管的用户界面,并同意你控制图片的大小.上传到server端的数据,并不须要处理enctype为 multi-part/form-data 的情况.只一个简单的POST表单处理程序就能够了. ...

随机推荐

【C++】动态开辟二维数组
二维数组在内存中的分配例如以下: C方式呈现: <span style="font-size:18px;"> #include <iostream> usi ...
ZTESoft 持续集成编年史之持续集成建设---自主研发（总括）
最终选择了自主研发,考虑到我们团队对java以及flex知识的储备,展示层使用夸浏览器的flex开发,后端业务层使用java. 一.方案: BEC + ZCIPAgent + ZCIPServer + ...
C#的百度地图开发(一)发起HTTP请求
原文:C#的百度地图开发(一)发起HTTP请求百度地图的开发文档中给出了很多的事例,而当用到具体的语言来开发时,又会有些差异.我是使用C#来开发的.在获取相应的数据时,需要通过URL传值,然后获取相 ...
Django写的投票系统1（转）
当然主要是从django的帮助文档里面来的,权当是翻译吧这个投票系统的主要功能有 1.一个前台页面,可以让用户来投票 2.一个管理员页面,可以用来添加.修改.删除投票首页第一步要确定你已经安装了D ...
hdu 1398 Square Coins（生成函数，完全背包）
pid=1398">链接:hdu 1398 题意:有17种货币,面额分别为i*i(1<=i<=17),都为无限张. 给定一个值n(n<=300),求用上述货币能使价值 ...
mysql copy复制拷贝表数据及结构的几种方式(转)
mysql拷贝表操作我们会常常用到,下面就为您详细介绍几种mysql拷贝表的方式,希望对您学习mysql拷贝表方面能够有所帮助.假如我们有以下这样一个表:id username password--- ...
session与cookie的差别
session session 的工作机制是:为每一个訪客创建一个唯一的 id (UID),并基于这个 UID 来存储变量.UID 存储在 cookie 中,或者通过 URL 进行传导. ...
Hadoop认知--在不同的阶段
入门阶段出于兴趣,及工作中的简单有用,大约经过1个月的时间,完毕了对Hadoop的基本认知. 在这个月中我干了例如以下几件事 1.大体看了<Hadoop权威指南>.把里面的代码手工码了一 ...
《深入了解Android：Wi-Fi、NFC和GPS音量》勘误表
资源下载更新(我不知道为什么被115网盘屏蔽) 深入了解android它wifi-nfc-gps 115网盘礼包码:5lbee5qn4g5ghttp://115.com/lb/5lbee5qn4g5g ...
W5500 keep-alive的用途及使用
大家是否遇到过这种问题,W5500作为server已经建立连接,突然网线掉了,然后再去连接W5500.就连不上了. 为什么?以下对这个问题进行解释说明,并提出解决的方法. 图1中的上位机程序作为cli ...

hadoop得知；block数据块；mapreduce实现样例；UnsupportedClassVersionError变态；该项目的源代码相关联

hadoop得知；block数据块；mapreduce实现样例；UnsupportedClassVersionError变态；该项目的源代码相关联的更多相关文章

随机推荐

热门专题