Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

在使用Bulkload向HBase导入数据中, 自己编写Map与使用KeyValueSortReducer生成HFile时, 出现了以下的异常:

java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 201311195100000000000000010000000000001600

at org.apache.hadoop.hbase.regionserver.StoreFile$Writer.appendGeneralBloomfilter(StoreFile.java:869)

   at org.apache.hadoop.hbase.regionserver.StoreFile$Writer.append(StoreFile.java:905)

   at org.apache.hadoop.hbase.mapreduce.HFileOutputFormat$1.write(HFileOutputFormat.java:180)

   at org.apache.hadoop.hbase.mapreduce.HFileOutputFormat$1.write(HFileOutputFormat.java:136)

   at org.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWriter.write(ReduceTask.java:586)

   at org.apache.hadoop.mapreduce.TaskInputOutputContext.write(TaskInputOutputContext.java:80)

   at org.apache.hadoop.hbase.mapreduce.KeyValueSortReducer.reduce(KeyValueSortReducer.java:53)

   at org.apache.hadoop.hbase.mapreduce.KeyValueSortReducer.reduce(KeyValueSortReducer.java:36)

   at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:177)

   at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:649)

   at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:418)

   at org.apache.hadoop.mapred.Child$4.run(Child.java:255)

   at java.security.AccessController.doPrivileged(Native Method)

   at javax.security.auth.Subject.doAs(Subject.java:396)

   at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1190)

at org.apache.hadoop.mapred.Child.main(Child.java:249)

该异常在源代码的StoreFile类中, 即在使用StoreFile类生成HFile文件时抛出异常, 依据控制台异常信息能够知道异常出如今源代码StoreFile.java:905行处,此处是append方法,该方法调用appendGeneralBloomfilter方法,生成Bloom key, 源代码为:

public static class HFileGenerateMapper extends

			Mapper<LongWritable, Text, ImmutableBytesWritable, KeyValue> {

		private static int familyIndex = 0;

		private static Configuration conf = null;

		private static MyMD5 md5 = new MyMD5();

		@Override

		protected void setup(Context context) throws IOException,

				InterruptedException {

			conf = context.getConfiguration();

			familyIndex = conf.getInt("familyIndex",0);

		}

		@Override

		protected void map(LongWritable key, Text value, Context context)

				throws IOException, InterruptedException {

			ImmutableBytesWritable mykey = new ImmutableBytesWritable(

					value.toString().split(",")[0].getBytes());

			List<KeyValue> list = null;

			list = createKeyValue(value.toString());

			Iterator<KeyValue> it = list.iterator();

			while (it.hasNext()) {

				KeyValue kv = new KeyValue();

				kv = it.next();

				if (kv != null) {

					  context.write(mykey, kv);

				}

			}

		}

		/**

		 * a.CITY_NO,to_char(DT,'yyyy-MM-dd'),DATA_TYPE,E0,E1,E2,E3,E4,E5,

		 * MEASUREPOINTID,TRANSFORMERID,ZONEID,CAPACITY

		 * @param str

		 * @return

		 */

		private List<KeyValue> createKeyValue(String str) {

			List<KeyValue> list = new ArrayList<KeyValue>(CONSTANT_HBASE.TB2_FNColNames[familyIndex].length);

			String[] values = str.toString().split(",");

			String[] qualifiersName = CONSTANT_HBASE.TB2_FNColNames[familyIndex];

			for (int i = 0; i < qualifiersName.length; i++) {

				//须要作为rowKey的各个字段字符串组成RowKey

				String rowkey = values[1]+values[0]+values[11]+values[12];

				//加上32位的MD5

				rowkey += md5.getMD5Code(rowkey);

				String family = CONSTANT_HBASE.TB2_FamilyNames[familyIndex];

				String qualifier = qualifiersName[i];

			    String value_str = values[i+CONSTANT_HBASE.TB2_FNColIndex[familyIndex]-1];

				KeyValue kv = new KeyValue(Bytes.toBytes(rowkey),

						Bytes.toBytes(family), Bytes.toBytes(qualifier),

						CONSTANT_HBASE.timeStamp, Bytes.toBytes(value_str));

				list.add(kv);

			}

			return list;

		}

	}

关键出错的那一句在

ImmutableBytesWritable rowkey = new ImmutableBytesWritable(value.toString().split(",")[0].getBytes());

由于终于导入RowKey的是由多个字段的字符串+32位的MD5值拼接而成的,可是生成ImmutableBytesWritable mykey却仅仅用到第一个字段的字符串,而这个key是用来全局排序用的,所以须要mykey与KeyValue kv 的rowkey相等, 于是更改方法便是将map方法代码改成例如以下:

@Override

		protected void map(LongWritable key, Text value, Context context)

				throws IOException, InterruptedException {

			List<KeyValue> list = null;

			list = createKeyValue(value.toString());

			Iterator<KeyValue> it = list.iterator();

			while (it.hasNext()) {

				KeyValue kv = new KeyValue();

				kv = it.next();

				if (kv != null) {

					  <span style="color:#FF0000;">context.write(new ImmutableBytesWritable(kv.getKey()), kv);</span>

				}

			}

		}

执行之后成功了,能够通过http://localhost:50030/jobtracker.jsp查看任务执行状态.

Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常的更多相关文章

hadoop报错java.io.IOException: Incorrect configuration: namenode address dfs.namenode.servicerpc-address or dfs.namenode.rpc-address is not configured
不多说,直接上干货! 问题详情问题排查 spark@master:~/app/hadoop$ sbin/start-all.sh This script is Deprecated. Instead ...
什么是Zookeeper，Zookeeper的作用是什么，在Hadoop及hbase中具体作用是什么
什么是Zookeeper,Zookeeper的作用是什么,它与NameNode及HMaster如何协作?在没有接触Zookeeper的同学,或许会有这些疑问.这里给大家总结一下. 一.什么是Zooke ...
Zookeeper的作用，在Hadoop及hbase中具体作用
什么是Zookeeper,Zookeeper的作用是什么,在Hadoop及hbase中具体作用是什么一.什么是Zookeeper ZooKeeper 顾名思义动物园管理员,他是拿来管大象(Hado ...
HBase中此类异常解决记录org.apache.hadoop.ipc.RemoteException(java.io.IOException):
ERROR: Can't get master address from ZooKeeper; znode data == null 一定注意这只是问题的第一层表象,真的问题是: File /hb ...
windows 中使用hbase 异常：java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
平时一般是在windows环境下进行开发,在windows 环境下操作hbase可能会出现异常(java.io.IOException: Could not locate executable nul ...
运行基准测试hadoop集群中的问题：org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /benchmarks/TestDFSIO/io_data/test_
在master(即:host2)中执行 hadoop jar hadoop-test-1.1.2.jar DFSCIOTest -write -nrFiles 12 -fileSize 10240 - ...
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries
在已经搭建好的集群环境Centos6.6+Hadoop2.7+Hbase0.98+Spark1.3.1下,在Win7系统Intellij开发工具中调试Spark读取Hbase.运行直接报错: ? 1 ...
hbase异常:java.io.IOException: Unable to determine ZooKeeper ensemble
项目中用到hbase,有时候可能会报一些异常,比如java.io.IOException: Unable to determine ZooKeeper ensemble 等等,当出现这个问题时,根据个 ...
hadoop异常：到目前为止解决的最牛逼的一个异常（java.io.IOException: Incompatible clusterIDs）
(注意: 本人用的版本为hadoop2.2.0, 旧的版本和此版本的解决方法不同) 异常为: 9 (storage id DS-2102177634-172.16.102.203-50010-1384 ...

随机推荐

HDU 3874 离线段树
在所有数字的统计范围,,对于重复统计只有一次离线段树算法排序终点坐标.然后再扫,反复交锋.把之前插入树行被删除 #include "stdio.h" #include &quo ...
inner join on, left join on, right join on
1.定义: inner join(等值连接) : 仅仅返回两个表中联结字段相等的记录 left join(左联接) :返回包含左表中的全部记录和右表中联结字段相等的记录 right join(右联接) ...
移动端像素渲染流水线与GPU Hack
什么是像素渲染流水线 web页面你所写的页面代码是如何被转换成屏幕上显示的像素的.这个转换过程可以归纳为这样的一个流水线,包含五个关键步骤: 1.JavaScript:一般来说,我们会使用JavaS ...
ubuntu，从一个新用户，要转到新用户的命令行操作
shibo-ubuntu@ubuntu:~$ sudo useradd karen [sudo] password for shibo-ubuntu: shibo-ubuntu@ubuntu:~$ ...
理解git经常使用命令原理
git不同于类似SVN这样的版本号管理系统,尽管熟悉经常使用的操作就能够满足大部分需求,但为了在遇到麻烦时不至于靠蛮力去尝试,了解git的原理还是非常有必要. 文件通过git管理的文件版本号信息所有 ...
Docker简明教程（转）
Docker自从诞生以来就一直备受追捧,学习Docker是一件很炫酷.很有意思的事情.我希望通过这篇文章能够让大家快速地入门Docker,并有一些学习成果来激发自己的学习兴趣.我也只是一个在Docke ...
UnitOfWork应用
UnitOfWork以及其在ABP中的应用 Unit Of Work(UoW)模式在企业应用架构中被广泛使用,它能够将Domain Model中对象状态的变化收集起来,并在适当的时候在同一数据库连接和 ...
【 D3.js 入门系列 --- 10.2 】你可以拖动地图
我的个人博客是:www.ourd3js.com csdn博客为:blog.csdn.net/lzhlzz 转载请注明出处.谢谢. 本节是结合9.2节和10节的内容制作的一个可力学导向的中国地图,用 ...
Sizzle.selectors.relative [ 源代码分析 ]
1 jQuery 对象Sizzle.selectors.relative中存放了块间关系符和相应的块间关系过滤函数,称为"块间关系过滤函数集" 块间关系符共同拥有4种,其含义和过滤 ...
IOS开发——Protocol使用协议
protocol ['prəutəkɔl] (样例:http://blog.sina.com.cn/s/blog_6aafe9c90100yozz.html ) 一.说明两个类进行通讯,用协议就比 ...

Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常的更多相关文章

随机推荐

热门专题