HBase with MapReduce （SummaryToFile）

上一篇文章是实现统计hbase单元值出现的个数，并将结果存放到hbase的表中，本文是将结果存放到hdfs上。其中的map实现与前文一直，连接：http://www.cnblogs.com/ljy2013/p/4820056.html，下面主要介绍一下reduce的实现：

（1）reduce的实现

package com.datacenter.HbaseMapReduce.SummaryToFile;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Reducer;

public class SummaryToFileReducer extends

		Reducer<Text, IntWritable, Text, IntWritable> {

	@Override

	protected void reduce(Text key, Iterable<IntWritable> values, Context context)

			throws IOException, InterruptedException {

		// TODO Auto-generated method stub

		 int i = 0;

		    for (IntWritable val : values) {

		      i += val.get();

		    }

		    context.write(key, new IntWritable(i));

	}

}

（2）主类的实现也有些不同

package com.datacenter.HbaseMapReduce.SummaryToFile;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HConnection;

import org.apache.hadoop.hbase.client.HConnectionManager;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SummaryToFilemain {

	static String rootdir = "hdfs://hadoop3:8020/hbase";

	static String zkServer = "hadoop3";

	static String port = "2181";

	private static Configuration conf;

	private static HConnection hConn = null;

	public static void HbaseUtil(String rootDir, String zkServer, String port) {

		conf = HBaseConfiguration.create();// 获取默认配置信息

		conf.set("hbase.rootdir", rootDir);

		conf.set("hbase.zookeeper.quorum", zkServer);

		conf.set("hbase.zookeeper.property.clientPort", port);

		try {

			hConn = HConnectionManager.createConnection(conf);

		} catch (IOException e) {

			// TODO Auto-generated catch block

			e.printStackTrace();

		}

	}

	public static void main(String[] args) throws Exception{

		// TODO Auto-generated method stub

		HbaseUtil(rootdir, zkServer, port);

		Job job = new Job(conf,"ExampleSummaryToFile");

		job.setJarByClass(SummaryToFilemain.class);     // class that contains mapper and reducer

		Scan scan = new Scan();

		scan.setCaching(500);        // 1 is the default in Scan, which will be bad for MapReduce jobs

		scan.setCacheBlocks(false);  // don't set to true for MR jobs

		// set other scan attrs

		TableMapReduceUtil.initTableMapperJob(

		  "test",        // input table

		  scan,               // Scan instance to control CF and attribute selection

		  SummaryMapper.class,     // mapper class

		  Text.class,         // mapper output key

		  IntWritable.class,  // mapper output value

		  job);

		job.setReducerClass(SummaryToFileReducer.class);    // reducer class

		job.setNumReduceTasks(1);    // at least one, adjust as required

		FileOutputFormat.setOutputPath(job, new Path("hdfs://hadoop3:8020/user/liujiyu/score-test"));  // adjust directories as required

		boolean b = job.waitForCompletion(true);

		if (!b) {

		  throw new IOException("error with job!");

		}

	}

}

HBase with MapReduce （SummaryToFile）的更多相关文章

HBase with MapReduce （Summary）
我们知道,hbase没有像关系型的数据库拥有强大的查询功能和统计功能,本文实现了如何利用mapreduce来统计hbase中单元值出现的个数,并将结果携带目标的表中, (1)mapper的实现 pac ...
Hbase 技术细节笔记（上）
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:张秀云前言最近在跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hbase的 ...
深入HBase架构解析（二）【转】
转自:http://www.blogjava.net/DLevin/archive/2015/08/22/426950.html 前言这是<深入HBase架构解析(一)>的续,不多废话, ...
[转]毕设- 深入HBase架构解析（二）
深入HBase架构解析(二) 前言这是<深入HBase架构解析(一)>的续,不多废话,继续.... HBase读的实现通过前文的描述,我们知道在HBase写时,相同Cell(RowKe ...
HBase框架基础（四）
* HBase框架基础(四) 上一节我们介绍了如何使用HBase搞一些MapReduce小程序,其主要作用呢是可以做一些数据清洗和分析或者导入数据的工作,这一节我们来介绍如何使用HBase与其他框架进 ...
HBase框架基础（三）
* HBase框架基础(三) 本节我们继续讨论HBase的一些开发常识,以及HBase与其他框架协调使用的方式.在开始之前,为了框架之间更好的适配,以及复习之前HBase的配置操作,请使用cdh版本的 ...
HBase框架基础（一）
* HBase框架基础(一) 官方网址:http://hbase.apache.org/ * HBase是什么妖怪? 要解释HBase,我们就先说一说经常接触到的RDBMS,即关系型数据库: ** m ...
HBase框架基础（二）
* HBase框架基础(二) 上一节我们了解了HBase的架构原理和模块组成,这一节我们先来聊一聊HBase的读写数据的过程. * HBase的读写流程及3个机制 HBase的读数据流程: 1.HRe ...
MapReduce（二）
MapReduce(二) mapreduce 将Text转化为对象进行处理数据. 根据一来说,将date,classname,name,subject,score变为对象属性我的数据是:是有重复的. ...

随机推荐

再次熟悉jdbc连接mysql
闲来无事想探究一下jdbc 1.首先准备工作.我们要下载jdbc驱动包mysql-connector-java-5.1.7-bin.jar.其他的暂时先不用,这个包的下载地址:http://pan.b ...
Java菜鸟培训第二天
HTML——超文本标记语言…………… 静态网页:不需要访问数据库. 动态网页:在网上发布的好的,我们能通过网络浏览到的都是动态的,需要访问数据库. <html>--开始标签 <hea ...
[问题2014S08] 解答
[问题2014S08] 解答 (此解答由徐昊宸同学和鹿彭同学提供) 设 $P_1(\lambda),P_2(\lambda),Q_1(\lambda),Q_2(\lambda)$ 为可逆 \(\l ...
tcp/ip详解-ip头部选项字段
IP头部的选项字段作用:用于网络调试和测试 IP首部的可变部分就是一个可选字段.选项字段用来支持排错.测量以及安全等措施,内容很丰富.此字段的长度可变,从1个字节到40个字节不等,取决于所选择的项目 ...
c读写文件
#include<stdio.h> void main(void) { // locate ]; scanf("%s", filename); getchar(); / ...
$.ajax()常用方法详解(推荐)
AJAX 是一种与服务器交换数据的技术,可以在补充在整个页面的情况下更新网页的一部分.接下来通过本文给大家介绍ajax一些常用方法,大家有需要可以一起学习. 1.url: 要求为String类型的参数 ...
Mac 在命令行中获得Root权限
Mac 在命令行中获得Root权限作者 firedragonpzy 13 九月, 2012 2条评论本文为firedragonpzy原创,转载务必在明显处注明:转载自[Softeware MyZo ...
i2c设备驱动移植笔记（二）
说明:上一篇博客写了我在移植android驱动之TEF6606的苦逼遭遇,即驱动层向应用层提供接口支持,查找了两天的资料,不得不放弃,转而进行IIC下移植RTC设备的实验. 第一步:查找设备的数据手册 ...
Centos6 使用yum安装 mysql 5.7
直接使用yum安装默认安装的是mysql 5.1版本,要想安装mysql 5.7 需要设置yum源 1.检查系统默认mysql,并删除 yum list installed | grep mysql ...
Probit回归模型
Probit模型也是一种广义的线性模型,当因变量为分类变量时,有四种常用的分析模型: 1.线性概率模型(LPM)2.Logistic模型3.Probit模型4.对数线性模型和Logistic回归一样 ...

HBase with MapReduce （SummaryToFile）

HBase with MapReduce （SummaryToFile）的更多相关文章

随机推荐

热门专题