MapReduce 异常 LongWritable cannot be cast to Text

有一个txt文件，内容格公式是这样的：

深圳订做T恤	5729944

深圳厂家t恤批发	5729945

深圳定做文化衫	5729944

文化衫厂家	5729944

订做文化衫	5729944

深圳t恤厂家	5729945

前面是搜索关键词，后面的是所属的分类ID,以tab分隔，想统计分类情况。于是用以下的MapReduce程序跑了下：

import java.io.IOException;

import java.util.*;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.conf.*;

import org.apache.hadoop.io.*;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.lib.input.*;

import org.apache.hadoop.mapreduce.lib.output.*;

import org.apache.hadoop.util.*;

public class  ClassCount extends Configured implements Tool

{

	public static class ClassMap

		extends Mapper<Text ,Text,Text,IntWritable>

	{

		private static final IntWritable one = new IntWritable(1);

		private Text word = new Text();

		public void map(Text key,Text value,Context context)

			throws IOException,InterruptedException

		{

			String eachLine = value.toString();

			StringTokenizer tokenizer = new StringTokenizer(eachLine,"\n");

			while(tokenizer.hasMoreTokens())

			{

				StringTokenizer token = new StringTokenizer(tokenizer.nextToken(),"\t");

				String keyword = token.nextToken();//i don't use it now.

				String classId = token.nextToken();

				word.set(classId);

				context.write(word,one);

			}

		}

	}

	public static class Reduce

		extends Reducer<Text,IntWritable,Text,IntWritable>

	{

		public void reduce(Text key,Iterable<IntWritable> values,Context context)

			throws IOException,InterruptedException

		{

			int sum = 0;

			for(IntWritable val : values)

				sum += val.get();

			context.write(key,new IntWritable(sum));

		}

	}

	public int run(String args[]) throws Exception{

		Job job = new Job(getConf());

		job.setJarByClass(ClassCount.class);

		job.setJobName("classCount");

		job.setMapperClass(ClassMap.class);

		job.setReducerClass(Reduce.class);

		job.setInputFormatClass(TextInputFormat.class);

		job.setOutputFormatClass(TextOutputFormat.class);

		FileInputFormat.setInputPaths(job,new Path(args[0]));

		FileOutputFormat.setOutputPath(job,new Path(args[1]));

		boolean success = job.waitForCompletion(true);

		return success ?

0 : 1;

	}

	public static void main(String[] args) throws Exception

	{

		int ret = ToolRunner.run(new ClassCount(),args);

		System.exit(ret);

	}

}

抛出例如以下异常：

java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text

我以为输入的键是文本就用Text来作为key,但貌似不是这样子的，map方法把文件的行号当成key,所以要用LongWritable。

可是改过来之后，报了以下的异常：

14/04/25 17:21:15 INFO mapred.JobClient: Task Id : attempt_201404211802_0040_m_000000_1, Status : FAILED

java.io.IOException: Type mismatch in value from map: expected org.apache.hadoop.io.Text, recieved org.apache.hadoop.io.IntWritable

这个就更加直观了,须要在run方法中加入以下的两行以明白声明输入的格式。

	job.setMapOutputKeyClass(Text.class);

        job.setMapOutputValueClass(IntWritable.class);

MapReduce 异常 LongWritable cannot be cast to Text的更多相关文章

MapReduce异常：java.lang.ClassCastException: interface javax.xml.soap.Text
MapReduce异常:java.lang.ClassCastException: interface javax.xml.soap.Text java.lang.ClassCastException ...
Hadoop: LongWritable cannot be cast to org.apache.hadoop.io.IntWritable
写MR Job的时候遇到一个坑爹的异常: LongWritable cannot be cast to org.apache.hadoop.io.IntWritable 当写Map的时候,key的默认 ...
org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text
代码缺少这一行:job.setInputFormatClass(KeyValueTextInputFormat.class);
E QUERY [main] SyntaxError: identifier starts immediately after numeric literal mongodb mapReduce 异常分析集合命名规范
异常信息 repl_test:PRIMARY> db.0917order_totals_b.find()2018-09-28T15:13:03.992+0800 E QUERY [main] S ...
【Json】关于json解析时异常org.json.JSONException: A JSONObject text must begin with '{' at character 1 of {的解决方法
遇到这种异常有几种情况: 1.JSON格式有问题,检查一下格式. 2.格式没问题,仍然报错,这个是因为你的json文件头里带有编码字符(如UTF-8等),读取字符串时json串是正常的,但是解析就有异 ...
在hadoop上进行编写mapreduce程序，统计关键词在text出现次数
mapreduce的处理过程分为2个阶段,map阶段,和reduce阶段.在要求统计指定文件里的全部单词的出现次数时. map阶段把每一个关键词写到一行上以逗号进行分隔.并初始化数量为1(同样的单词h ...
编写第一个MapReduce程序—— 统计气温
摘要:hadoop安装完成后,像学习其他语言一样,要开始写一个“hello world!” ,看了一些学习资料,模仿写了个程序.对于一个C#程序员来说,写个java程序,并调用hadoop的包,并跑在 ...
Hadoop学习（4）-- MapReduce
MapReduce是一种用于大规模数据集的并行计算编程模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题.其主要思想Map(映射)和Reduce(规约)都是从函数是编程语言中借鉴而来的 ...
Mapreduce执行过程分析(基于Hadoop2.4)——(二)
4.3 Map类创建Map类和map函数,map函数是org.apache.hadoop.mapreduce.Mapper类中的定义的,当处理每一个键值对的时候,都要调用一次map方法,用户需要覆写 ...

随机推荐

利用VS2005进行dump文件调试（17篇博客）
前言:利用drwtsn32或NTSD进行程序崩溃处理,都可以生成可用于调试的dmp格式文件.使用VS2005打开生成的DMP文件,能很方便的找出BUG所在位置.本文将讨论以下内容: 1. 程序编译选 ...
POJ2392 SpaceElevator [DP]
题目大意:有一头奶牛要上太空,他有非常多种石头,每种石头的高度是hi,可是不能放到ai之上的高度.而且这样的石头有ci个将这些石头叠加起来.问可以达到的最高高度. 解题思路:首先对数据进行升序排序. ...
EasyUI - 使用一般处理程序 HttpHandler （.ashx）
以easyui中的panel中,使用url加载数据为列. 效果: html代码: <div id="p" style="padding: 10px;"&g ...
Eequal sum sets
Let us consider sets of positive integers less than or equal to n. Note that all elements of a set a ...
HBASE完全分布式模式的安装
1集群环境下hadoop.1.1.2已经安装成功 2配置hosts,及环境变量 3编辑hbase-env.xml 4编辑hbase-site.xml 5编辑regionservers文件 6把Hbas ...
delphi实现图象灰度处理的3种方法
灰度处理的方法主要有如下3种: 1.最大值法:使R.G.B的值等于3值中最大的一个,即: R=G=B=max(R,G,B) 最大值法会使形成高亮度很高的灰度图象 var bitmap:tbitma ...
MTU & MSS 详解记录（转）
先学习理解一下帧的封装格式: 需要注意的是,区别两种帧封装格式:802标准帧和以太网帧 1,在802标准定义的帧格式中,长度字段是指它后续数据的字节长度,但不包括C R C检验 ...
js获取手机型号和手机操作系统版本号
1.js 判断IOS版本号先来观察 iOS 的 User-Agent 串: iPhone 4.3.2 系统:Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_2 l ...
Skype无法显示登录界面
Skype升级之后突然抽风,双击运行程序之后,输入用户名和密码的窗口都没了,截图如下(本机为Windows 7 32bit版本): 卸载重新安装,也无济于事.删除注册表中的Skype的相关信息后问题依 ...
iebook 发布到网站独家秘诀
iebook 普通版只能产生exe文件,无法生成web公布的文件需要,因此,我们需要专业版. iebook2011版本并没有破解版,下面是一个iebook2010破解版: http://downloa ...

MapReduce 异常 LongWritable cannot be cast to Text

MapReduce 异常 LongWritable cannot be cast to Text的更多相关文章

随机推荐

热门专题