hbase与mapreduce集成

一：运行给定的案例

1.获取jar包里的方法

2.运行hbase自带的mapreduce程序

　　lib/hbase-server-0.98.6-hadoop2.jar　

3.具体运行

　　注意命令：mapredcp。

　　HADOOP_CLASSPATH是当前运行时需要的环境。

4.运行一个小方法

　　$HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar rowcounter nstest1:tb1

二：自定义hbase的数据拷贝

1.需求

　　将nstest1:tb1的数据info：name列拷贝到nstest1:tb2

2.新建tb2表

3.书写mapreduce程序

　　输入：rowkey，result。

 package com.beifeng.bigdat;

 import java.io.IOException;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.conf.Configured;

 import org.apache.hadoop.hbase.Cell;

 import org.apache.hadoop.hbase.CellUtil;

 import org.apache.hadoop.hbase.HBaseConfiguration;

 import org.apache.hadoop.hbase.client.Put;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.client.Scan;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

 import org.apache.hadoop.hbase.mapreduce.TableMapper;

 import org.apache.hadoop.hbase.mapreduce.TableReducer;

 import org.apache.hadoop.hbase.util.Bytes;

 import org.apache.hadoop.mapreduce.Job;

 import org.apache.hadoop.mapreduce.Mapper.Context;

 import org.apache.hadoop.util.Tool;

 import org.apache.hadoop.util.ToolRunner;

 public class HBaseMRTest extends Configured implements Tool{

     /**

      * map

      * @author      *

      */

     public static class tbMap extends TableMapper<ImmutableBytesWritable, Put>{

         @Override

         protected void map(ImmutableBytesWritable key, Result value,Context context) throws IOException, InterruptedException {

             Put put=new Put(key.get());

             for(Cell cell:value.rawCells()){

                 if("info".equals(Bytes.toString(CellUtil.cloneFamily(cell)))){

                     if("name".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))){

                         put.add(cell);

                         context.write(key, put);

                     }

                 }

             }

         }

     }

     /**

      * reduce

      * @author      *

      */

     public static class tbReduce extends TableReducer<ImmutableBytesWritable, Put, ImmutableBytesWritable>{

         @Override

         protected void reduce(ImmutableBytesWritable key, Iterable<Put> values,Context context)throws IOException, InterruptedException {

             for(Put put:values){

                 context.write(key, put);

             }

         }

     }

     public int run(String[] args) throws Exception {

         Configuration conf=super.getConf();

         Job job =Job.getInstance(conf, "hbasemr");

         job.setJarByClass(HBaseMRTest.class);

         Scan scan=new Scan();

         TableMapReduceUtil.initTableMapperJob(

                 "nstest1:tb1",

                 scan,

                 tbMap.class,

                 ImmutableBytesWritable.class,

                 Put.class,

                 job);

         TableMapReduceUtil.initTableReducerJob(

                 "nstest1:tb2",

                 tbReduce.class,

                 job);

         boolean issucess=job.waitForCompletion(true);

         return issucess?0:1;

     }

     public static void main(String[] args) throws Exception{

         Configuration conf=HBaseConfiguration.create();

         int status=ToolRunner.run(conf, new HBaseMRTest(), args);

         System.exit(status);

     }

 }

4.打成jar包

5.运行语句

　　加上需要的export前提。

　　$HADOOP_HOME/bin/yarn jar /etc/opt/datas/HBaseMR.jar com.beifeng.bigdat.HBaseMRTest

6.效果

hbase与mapreduce集成的更多相关文章

HBase概念学习（七）HBase与Mapreduce集成
这篇文章是看了HBase权威指南之后,依据上面的解说搬下来的样例,可是略微有些不一样. HBase与mapreduce的集成无非就是mapreduce作业以HBase表作为输入,或者作为输出,也或者作 ...
HBase 与 MapReduce 集成
6. HBase 与 MapReduce 集成 6.1 官方 HBase 与 MapReduce 集成查看 HBase 的 MapReduce 任务的执行:bin/hbase mapredcp; 环 ...
074 hbase与mapreduce集成
一:运行给定的案例 1.获取jar包里的方法 2.运行hbase自带的mapreduce程序 lib/hbase-server-0.98.6-hadoop2.jar 3.具体运行注意命令:mapre ...
【HBase】HBase与MapReduce集成——从HDFS的文件读取数据到HBase
目录需求步骤一.创建maven工程,导入jar包二.开发MapReduce程序三.结果需求将HDFS路径 /hbase/input/user.txt 文件的内容读取并写入到HBase 表 ...
hbase运行mapreduce设置及基本数据加载方法
hbase与mapreduce集成后,运行mapreduce程序,同时需要mapreduce jar和hbase jar文件的支持,这时我们需要通过特殊设置使任务可以同时读取到hadoop jar和h ...
【HBase】HBase与MapReduce的集成案例
目录需求步骤一.创建maven工程,导入jar包二.开发MapReduce程序三.运行结果 HBase与MapReducer集成官方帮助文档:http://archive.cloudera. ...
大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化
第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...
Hbase与hive集成与对比
HBase与Hive的对比 1．Hive (1) 数据仓库 Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询. (2) 用于数据分析.清洗 ...
《OD大数据实战》HBase整合MapReduce和Hive
一.HBase整合MapReduce环境搭建 1. 搭建步骤1)在etc/hadoop目录中创建hbase-site.xml的软连接.在真正的集群环境中的时候,hadoop运行mapreduce会通过 ...

随机推荐

阿里云DRDS:分布式数据库服务
最近在做阿里云相关的项目,用到阿里的很多接口服务的API,于是想把这段项目做个总结,顺便梳理下阿里云的云计算的相关知识点. DRDS:分布式数据库服务. 1.相关术语 DRDS(Distribute ...
简单几何(推公式) UVA 11646 Athletics Track
题目传送门题意:给了长宽比例,操场一圈400米,问原来长宽的长度分析:推出公式 /************************************************ * Author ...
简单几何(四边形形状) UVA 11800 Determine the Shape
题目传送门题意:给了四个点,判断能构成什么图形,有优先规则分析:正方形和矩形按照点积为0和长度判断,菱形和平行四边形按向量相等和长度判断,梯形按照叉积为0判平行.因为四个点是任意给出的,首先要进行 ...
BZOJ3276 : 磁力
按距离建立线段树,维护区间重量最小值然后跑一遍拓扑,每次将所有能取的加入队尾 #include<cstdio> #include<algorithm> #define N 2 ...
POJ 2117 (割点+连通分量)
题目链接: http://poj.org/problem?id=2117 题目大意:在一个非连通图中,求一个切除图中任意一个割点方案,使得图中连通分量数最大. 解题思路: 一个大陷阱,m可以等于0,这 ...
HDU 1242 (BFS搜索+优先队列)
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=1242 题目大意:多个起点到一个终点,普通点耗时1,特殊点耗时2,求到达终点的最少耗时. 解题思路: ...
洛谷 P1009 阶乘之和 Label：高精度
题目描述用高精度计算出S=1!+2!+3!+…+n!(n≤50) 其中“!”表示阶乘,例如:5!=5*4*3*2*1. 输入输出格式输入格式: 一个正整数N. 输出格式: 一个正整数S,表示计算结 ...
【wikioi】1295 N皇后问题
题目链接算法:DFS 刚开始卡了我一下,我竟然傻到用二维来放皇后= =.导致一直TLE.... 其实用1维就行了的,下标为行(列),值为列(行) 我是用下标为列做的. 上代码 #include &l ...
【SPOJ】10628. Count on a tree（lca+主席树+dfs序）
http://www.spoj.com/problems/COT/ (速度很快,排到了rank6) 这题让我明白了人生T_T 我知道我为什么那么sb了. 调试一早上都在想人生. 唉. 太弱. 太弱. ...
关于Ruby的一些知识
1 -9/2 ＝ -5 当进行一个除法运算的结果是一个负数的时候,由于Ruby采取向负无穷大圆整,所以结果是-5.而由于除数是个整数,所以结果也是一个整数.而其他语言多数是向0取整. 2 连接字符串建 ...

hbase与mapreduce集成

hbase与mapreduce集成的更多相关文章

随机推荐

热门专题