hbase 从hbase上读取数据写入到hdfs

Mapper

 package cn.hbase.mapreduce.hb2hdfs;

 import java.io.IOException;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.mapreduce.TableMapper;

 /**

  *

  * @author Tele

  *

  * 输出key 行键 输出out 读出的一行数据

  */

 public class ReadFruitFromHbMapper extends TableMapper<ImmutableBytesWritable, Result> {

     @Override

     protected void map(ImmutableBytesWritable key, Result value, Context context)

             throws IOException, InterruptedException {

         context.write(key, value);

     }

 }

Reducer

 package cn.hbase.mapreduce.hb2hdfs;

 import java.io.IOException;

 import org.apache.hadoop.hbase.Cell;

 import org.apache.hadoop.hbase.CellScanner;

 import org.apache.hadoop.hbase.CellUtil;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.util.Bytes;

 import org.apache.hadoop.io.NullWritable;

 import org.apache.hadoop.io.Text;

 import org.apache.hadoop.mapreduce.Reducer;

 /**

  *

  * @author Tele

  *

  */

 public class WriteFruit2HdfsReducer extends Reducer<ImmutableBytesWritable, Result, NullWritable, Text> {

     @Override

     protected void reduce(ImmutableBytesWritable key, Iterable<Result> values, Context context)

             throws IOException, InterruptedException {

         for (Result result : values) {

             CellScanner scanner = result.cellScanner();

             while (scanner.advance()) {

                 Cell cell = scanner.current();

                 Text text = new Text();

                 // 封装数据

                 String row = Bytes.toString(CellUtil.cloneRow(cell)) + "\t";

                 String cf = Bytes.toString(CellUtil.cloneFamily(cell)) + "\t";

                 String cn = Bytes.toString(CellUtil.cloneQualifier(cell)) + "\t";

                 String value = Bytes.toString(CellUtil.cloneValue(cell)) + "\t";

                 StringBuffer buffer = new StringBuffer();

                 buffer.append(row).append(cf).append(cn).append(value);

                 text.set(buffer.toString());

                 // 写出

                 context.write(NullWritable.get(), text);

             }

         }

     }

 }

Runner

 package cn.hbase.mapreduce.hb2hdfs;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.conf.Configured;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.hbase.HBaseConfiguration;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.client.Scan;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

 import org.apache.hadoop.io.NullWritable;

 import org.apache.hadoop.io.Text;

 import org.apache.hadoop.mapreduce.Job;

 import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

 import org.apache.hadoop.util.Tool;

 import org.apache.hadoop.util.ToolRunner;

 /**

  *

  * @author Tele

  *

  */

 public class FruitRunner extends Configured implements Tool {

     public int run(String[] args) throws Exception {

         System.setProperty("HADOOP_USER_NAME", "tele");

         // 实例化job

         Job job = Job.getInstance(this.getConf());

         // 设置jar

         job.setJarByClass(FruitRunner.class);

         // 设置缓存行键

         Scan scan = new Scan();

         scan.setCaching(300);

 　　　　　　

         // 组装mapper

         TableMapReduceUtil.initTableMapperJob("fruit", scan, ReadFruitFromHbMapper.class, ImmutableBytesWritable.class,

                 Result.class, job);

         // 组装reuder

         job.setReducerClass(WriteFruit2HdfsReducer.class);

         job.setOutputKeyClass(NullWritable.class);

         job.setOutputValueClass(Text.class);

         FileOutputFormat.setOutputPath(job, new Path("/outputfruit"));

         // reduce个数

         job.setNumReduceTasks(1);

         // 提交

         return job.waitForCompletion(true) ? 0 : 1;

     }

     public static void main(String[] args) throws Exception {

         Configuration conf = HBaseConfiguration.create();

         ToolRunner.run(conf, new FruitRunner(), args);

     }

 }

hbase 从hbase上读取数据写入到hdfs的更多相关文章

从PCI上读取数据线程和定时器效率
从PCI上读取数据线程和定时器效率线程: mythread=AfxBeginThread(StartContinuous,(LPVOID)1,THREAD_PRIORITY_NORMAL,0,CR ...
flume学习（三）：flume将log4j日志数据写入到hdfs（转）
原文链接:flume学习(三):flume将log4j日志数据写入到hdfs 在第一篇文章中我们是将log4j的日志输出到了agent的日志文件当中.配置文件如下: tier1.sources=sou ...
Flink 使用（一）——从kafka中读取数据写入到HBASE中
1.前言本文是在<如何计算实时热门商品>[1]一文上做的扩展,仅在功能上验证了利用Flink消费Kafka数据,把处理后的数据写入到HBase的流程,其具体性能未做调优.此外,文中并未就 ...
Redis 中文入库成功，读取数据写入文件乱码问题
近期须要用到redis ,可是在编码这个问题上,纠结了非常久. 需求 :每天一个进程将中文文件入库到redis中(不定时更新) ,另外几个进程读取redis中的信息 ,并处理数据结果.使 ...
《程序实现》从xml、txt文件里读取数据写入excel表格
直接上码 import java.io.BufferedReader; import java.io.DataInputStream; import java.io.File; import java ...
hbase 从hdfs上读取数据到hbase中
<dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifact ...
通过POI实现上传EXCEL的批量读取数据写入数据库
最近公司新增功能要求导入excel,并读取其中数据批量写入数据库.于是就开始了这个事情,之前的文章,记录了上传文件,本篇记录如何通过POI读取excel数据并封装为对象上传. 上代码: 1.首先这是一 ...
java读取数据写入txt文件并将读取txt文件写入另外一个表
package com.xsw.test; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.F ...
用kettle从mysql中使用存储过程读取数据写入到sqlserver数据库
1.mysql存储过程,可以实现动态表读取,满足较为复杂的业务逻辑 DROP PROCEDURE if exists p_get_car_trace; delimiter // CREATE PROC ...

随机推荐

使用 Python 第三方库 daft 绘制 PGM 中的贝叶斯网络
daft 的官方文档请见 DAFT:BEAUTIFULLY RENDERED PROBABILISTIC GRAPHICAL MODELS. from matplotlib import rc rc( ...
Codeforces Beta Round #16 E. Fish (状压dp)（概率dp）
Codeforces Beta Round #16 (Div. 2 Only) E. Fish 题目链接:## 点击打开链接题意: 有 \(n\) 条鱼,每两条鱼相遇都会有其中一只吃掉对方,现在给你 ...
Android AutoWrapTextView 解决中英文排版问题
1.概述最近项目有新需求,UED给了个卡券密码的UI样式,如图: 我一看很简单啊,一个TextView解决问题,然后做好以后在模拟器里一看..... 纳尼,这个时候才想起来,TextView 中英文 ...
常用的Windows命令
常用的Windows命令 explorer-------打开资源管理器 logoff---------注销命令 shutdown-------关机命令 lusrmgr.msc----本机用户和组 se ...
POJ 1852 Ants || UVA 10881 - Piotr's Ants 经典的蚂蚁问题
两题很有趣挺经典的蚂蚁问题. 1.n只蚂蚁以1cm/s的速度在长为L的竿上爬行,当蚂蚁爬到竿子的端点就会掉落.当两只蚂蚁相撞时,只能各自反向爬回去.对于每只蚂蚁,给出距离左端的距离xi,但不知道它的朝 ...
POJ 2536 Gopher II (ZOJ 2536) 二分图匹配
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=1882 http://poj.org/problem?id=2536 题目大 ...
Flask项目之手机端租房网站的实战开发（一）
说明:该篇博客是博主一字一码编写的,实属不易,请尊重原创,谢谢大家! 一丶项目介绍产品:关于手机移动端的租房网站角色:在这个产品中用户包括房东与房客功能:房东可以在这个平台发布自己的房屋,房客可 ...
【例题 6-19 UVA - 1572】Self-Assembly
[链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] 旋转和翻转,会发现. 如果可以顺着某个方向一直放的话. 总是能转换成往下或者往右连的. 则只要能够出现一个连接顺序的循环,则总是有解 ...
[Node] Setup an Nginx Proxy for a Node.js App
Learn how to setup an Nginx proxy server that sits in front of a Node.js app. You can use a proxy to ...
js进阶ajax基本用法（创建对象，连接服务器，发送请求，获取服务器传过来的数据）
js进阶ajax基本用法(创建对象,连接服务器,发送请求,获取服务器传过来的数据) 一.总结 1.ajax的浏览器的window对象的XMLHtmlRequest对象的两个重要方法:open(),se ...

hbase 从hbase上读取数据写入到hdfs

hbase 从hbase上读取数据写入到hdfs的更多相关文章

随机推荐

热门专题