HBase with MapReduce （MultiTable Read）

hbase当中没有两表联查的操作，要实现两表联查或者在查询一个表的同时也需要访问另外一张表的时候，可以通过mapreduce的方式来实现，实现方式如下：由于查询是map过程，因此这个过程不需要设计reduce过程。

（1）map的实现

package com.datacenter.HbaseMapReduce.MultiReadTable;

import java.io.IOException;

import java.util.NavigableMap;

import java.util.Map.Entry;

import org.apache.hadoop.hbase.client.HConnection;

import org.apache.hadoop.hbase.client.HTableInterface;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

import org.apache.hadoop.hbase.mapreduce.TableMapper;

import org.apache.hadoop.hbase.util.Bytes;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import com.datacenter.HbaseMapReduce.Read.ReadHbase;

public class MuliTableReadmapper extends TableMapper<Text, LongWritable> {

	private ResultScanner rs=null; 

	@Override

	protected void map(ImmutableBytesWritable key, Result value, Context context)

			throws IOException, InterruptedException {

		// TODO Auto-generated method stub

		printResult(value);

		//输出第二张表的内容

		Result temp=rs.next();//这个结果只是一个单元的结果，所谓一个单元可以理解成是一行的数据

		while(temp!=null){

			printResult(temp);

			temp=rs.next();

		}

	}

	@Override

	protected void setup(Context context) throws IOException,

			InterruptedException {

		// TODO Auto-generated method stub

		HConnection hconn = MultiReadTableMain.HbaseUtil(

				MultiReadTableMain.rootdir, MultiReadTableMain.zkServer,

				MultiReadTableMain.port);

		HTableInterface ht = hconn.getTable("test");

		Scan scan = new Scan();

		scan.setCaching(500); // 1 is the default in Scan, which will be bad for

								// MapReduce jobs

		scan.setCacheBlocks(false); // don't set to true for MR jobs

		rs = ht.getScanner(scan);

	}

	// 按顺序输出

	public void printResult(Result rs) {

		if (rs.isEmpty()) {

			System.out.println("result is empty!");

			return;

		}

		NavigableMap<byte[], NavigableMap<byte[], NavigableMap<Long, byte[]>>> temps = rs

				.getMap();

		String rowkey = Bytes.toString(rs.getRow()); // actain rowkey

		System.out.println("rowkey->" + rowkey);

		for (Entry<byte[], NavigableMap<byte[], NavigableMap<Long, byte[]>>> temp : temps

				.entrySet()) {

			System.out.print("\tfamily->" + Bytes.toString(temp.getKey()));

			for (Entry<byte[], NavigableMap<Long, byte[]>> value : temp

					.getValue().entrySet()) {

				System.out.print("\tcol->" + Bytes.toString(value.getKey()));

				for (Entry<Long, byte[]> va : value.getValue().entrySet()) {

					System.out.print("\tvesion->" + va.getKey());

					System.out.print("\tvalue->"

							+ Bytes.toString(va.getValue()));

					System.out.println();

				}

			}

		}

	}

}

（2）主类的实现

package com.datacenter.HbaseMapReduce.MultiReadTable;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HConnection;

import org.apache.hadoop.hbase.client.HConnectionManager;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.output.NullOutputFormat;

import com.datacenter.HbaseMapReduce.Read.ReadHbase;

import com.datacenter.HbaseMapReduce.Read.ReadHbaseMapper;

public class MultiReadTableMain {

	static public String rootdir = "hdfs://hadoop3:8020/hbase";

	static public String zkServer = "hadoop3";

	static public String port = "2181";

	private static Configuration conf;

	private static HConnection hConn = null;

	public static HConnection HbaseUtil(String rootDir, String zkServer, String port) {

		conf = HBaseConfiguration.create();// 获取默认配置信息

		conf.set("hbase.rootdir", rootDir);

		conf.set("hbase.zookeeper.quorum", zkServer);

		conf.set("hbase.zookeeper.property.clientPort", port);

		try {

			hConn = HConnectionManager.createConnection(conf);

		} catch (IOException e) {

			// TODO Auto-generated catch block

			e.printStackTrace();

		}

		return hConn;

	}

	public static void main(String[] args) throws Exception {

		// TODO Auto-generated method stub

		HbaseUtil(rootdir, zkServer, port);

		// Configuration config = HBaseConfiguration.create();

		Job job = new Job(conf, "ExampleRead");

		job.setJarByClass(ReadHbase.class); // class that contains mapper

		Scan scan = new Scan();

		scan.setCaching(500); // 1 is the default in Scan, which will be bad for

								// MapReduce jobs

		scan.setCacheBlocks(false); // don't set to true for MR jobs

		// set other scan attrs

		TableMapReduceUtil.initTableMapperJob("score", // input HBase table name

				scan, // Scan instance to control CF and attribute selection

				MuliTableReadmapper.class, // mapper

				null, // mapper output key

				null, // mapper output value

				job);

		job.setOutputFormatClass(NullOutputFormat.class); // because we aren't

															// emitting anything

															// from mapper

		boolean b = job.waitForCompletion(true);

		if (!b) {

			throw new IOException("error with job!");

		}

	}

}

HBase with MapReduce （MultiTable Read）的更多相关文章

HBase with MapReduce （Only Read）
最近在学习HBase,在看到了如何使用Mapreduce来操作Hbase,下面将几种情况介绍一下,具体的都可以参照官网上的文档说明.官网文档连接:http://hbase.apache.org/boo ...
[转帖]HBase详解（很全面）
HBase详解(很全面) very long story 简单看了一遍很多不明白的地方.. 2018-06-08 16:12:32 卢子墨阅读数 34857更多分类专栏: HBase [转自 ...
HBase Block Cache（块缓存）
Block Cache HBase提供了两种不同的BlockCache实现,用于缓存从HDFS读出的数据.这两种分别为: 默认的,存在于堆内存的(on-heap)LruBlockCache 存在堆外内 ...
HBase笔记4（调优）
Master/Region Server调优 JVM调优默认的RegionServer内存是1G,而Memstore默认占40%,即400M,实在是太小了,可以通过HBASE_HEAPSIZE参数修 ...
HBase with MapReduce （SummaryToFile）
上一篇文章是实现统计hbase单元值出现的个数,并将结果存放到hbase的表中,本文是将结果存放到hdfs上.其中的map实现与前文一直,连接:http://www.cnblogs.com/ljy20 ...
HBase with MapReduce （Summary）
我们知道,hbase没有像关系型的数据库拥有强大的查询功能和统计功能,本文实现了如何利用mapreduce来统计hbase中单元值出现的个数,并将结果携带目标的表中, (1)mapper的实现 pac ...
HBase with MapReduce （Read and Write）
上面一篇文章仅仅是介绍如何通过mapReduce来对HBase进行读的过程,下面将要介绍的是利用mapreduce进行读写的过程,前面我们已经知道map实际上是读过程,reduce是写的过程,然而ma ...
Hadoop学习笔记—15.HBase框架学习（基础实践篇）
一.HBase的安装配置 1.1 伪分布模式安装伪分布模式安装即在一台计算机上部署HBase的各个角色,HMaster.HRegionServer以及ZooKeeper都在一台计算机上来模拟. 首先 ...
hbase 集群（完全分布式）方式安装
一,环境 1, 主节点一台: ubuntu desktop 16.04 zhoujun 172.16.12.1 从节点(slave)两台:ubuntu server 16.04 hadoo ...

随机推荐

innodb数据结构
Jeremy Cole on InnoDB architecture : Efficiently traversing InnoDB B+Trees with the page directory ...
SQL标签
SQL标签库提供了与关系型数据库进行交互的标签. 引入语法:<%@ taglib prefix="sql" uri="http://java.sun.com/jsp ...
MySQL配置文件mysql.ini参数详解
my.ini(Linux系统下是my.cnf),当mysql服务器启动时它会读取这个文件,设置相关的运行环境参数. my.ini分为两块:Client Section和Server Section. ...
Android中插件开发篇之----动态加载Activity(免安装运行程序)
一.前言又到周末了,时间过的很快,今天我们来看一下Android中插件开发篇的最后一篇文章的内容:动态加载Activity(免安装运行程序),在上一篇文章中说道了,如何动态加载资源(应用换肤原理解析 ...
easyui filter 过滤时间段
$.extend($.fn.datagrid.defaults.filters, { dateRange: { init: function(container, options){ var c = ...
kibana安装与基础用法
来自官网,版本为4.5 下载rpm包并安装 wget -c https://download.elastic.co/kibana/kibana/kibana-4.5.4-1.x86_64.rpm rp ...
oracle组查询
概念: 所谓组查询即将数据按照某列或者某些列相同的值进行分组,然后对该组的数据进行组函数运用,针对每一组返回一个结果. note: 1.组函数可以出现的位置: select子句和having 子句 2 ...
linux 修改home目录下的中文目录名为英文
编辑home/下的 .config/user-dirs.dirs,把所有的中文名称修改为英文名称在home目录下创建对应的英文名称路径运行 xdg-user-dirs-update 重启机器
Linux进程基础
Linux进程基础作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 计算机实际上可以做的事情实质上非常简单,比如计算两个数的和 ...
U9单据UI开发--单据类型UI开发
1.在解决方案下新建UI界面项目,命名以UI作为后缀 2.先删除系统默认新建的UI界面数据模型,并新建界面数据 3.新建单据类型UIModel(界面数据),以model作为界面数据后缀名 4.修改单据 ...

HBase with MapReduce （MultiTable Read）

HBase with MapReduce （MultiTable Read）的更多相关文章

随机推荐

热门专题