Hbase使用MapReduce编程导出数据到HDFS

废话少说，直接上代码！

package cn.com.oozie.demo;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class HbaseExportHtable {

   public static class HbaseMapper extends TableMapper<Text, Text> {
       @Override
       public void map(ImmutableBytesWritable row, Result values,
               Context context) throws IOException {
           StringBuilder sb = new StringBuilder();
           String str = "&&";
           for (KeyValue keyValue : values.raw()) {
               sb.append(new String(keyValue.getValue())).append(str);
           }

           try {
               context.write(new Text(row.get()),
                       new Text(sb.substring(0, sb.length()-2)));
           } catch (InterruptedException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           }

       }
   }

   public static class HbaseReducer

   extends Reducer<Text, Text, NullWritable, Text> {


       public void reduce(Text key, Iterable<Text> values, Context context) {
           Text result = new Text();
           StringBuilder sb = new StringBuilder();
           String str = "&&";
           for (Text text : values) {
               result = text;
           }
       result=new Text(sb.append(key.toString()).append(str).append(result.toString()).toString());
           try {
               context.write(NullWritable.get(), result);
           } catch (IOException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           } catch (InterruptedException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           }
       }
   }

   public static void main(String[] args) throws IOException,
           ClassNotFoundException, InterruptedException {
       Configuration conf = HBaseConfiguration.create();
       /*conf.set("hbase.zookeeper.property.clientPort", "2181");
       conf.set("hbase.zookeeper.quorum",
               "hadoop-master-node,hadoop-slave1-node,hadoop-slave2-node");
       conf.set("user.name", "hadoop");
       conf.set("groups.name", "hadoop");
       conf.set("mapred.job.tracker", "hadoop-master-node:8021");*/
       Job job = new Job(conf, "HbaseExportHtable");
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(NullWritable.class);
       job.setReducerClass(HbaseReducer.class);
       job.setJarByClass(HbaseExportHtable.class);
       Scan scan = new Scan();
       TableMapReduceUtil.initTableMapperJob("phone_http_log", scan, HbaseMapper.class,
               Text.class, Text.class, job);
       FileOutputFormat.setOutputPath(job, new Path(
               "hdfs://hadoop-master:8020/user/oozie/outputdir"));
       System.exit(job.waitForCompletion(true) ? 0 : 1);
   }
}

按照列族遍历，导出数据到文本！

Hbase使用MapReduce编程导出数据到HDFS的更多相关文章

sqoop导出数据|Hive|HDFS和脚本编写
导出数据在Sqoop中,“导出”概念指:从大数据集群(HDFS,HIVE,HBASE)向非大数据集群(RDBMS)中传输数据,叫做:导出,即使用export关键字. HIVE/HDFS到RDBMS ...
使用MapReduce将mysql数据导入HDFS
package com.zhen.mysqlToHDFS; import java.io.DataInput; import java.io.DataOutput; import java.io.IO ...
【原创】MapReduce备份Elasticsearch数据到HDFS(JAVA)
一.环境:JAVA8,Elasticsearch-5.6.2,Hadoop-2.8.1二.实现功能:mapreduce读elasticsearch数据.输出parquet文件.多输出路径三.主要依赖 ...
Hadoop之——HBASE结合MapReduce批量导入数据
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/46463889 废话不多说.直接上代码,你懂得 package hbase; imp ...
Excel导出数据Excel.Application组件权限设置方法
很多网络应用系统都会涉及到数据采用Excel方式导出的模块,部分朋友问我到底怎么弄,其实方式很多种,目前比较优秀的方式还是直接用Excel的Excel.Application方式比较合适. 采用Exc ...
HBase结合MapReduce批量导入（HDFS中的数据导入到HBase）
HBase结合MapReduce批量导入 package hbase; import java.text.SimpleDateFormat; import java.util.Date; import ...
hive和hbase本质区别——hbase本质是OLTP的nosql DB，而hive是OLAP 底层是hdfs，需从已有数据库同步数据到hdfs;hive可以用hbase中的数据，通过hive表映射到hbase表
对于hbase当前noSql数据库的一种,最常见的应用场景就是采集的网页数据的存储,由于是key-value型数据库,可以再扩展到各种key-value应用场景,如日志信息的存储,对于内容信息不需要完 ...
《OD大数据实战》HBase整合MapReduce和Hive
一.HBase整合MapReduce环境搭建 1. 搭建步骤1)在etc/hadoop目录中创建hbase-site.xml的软连接.在真正的集群环境中的时候,hadoop运行mapreduce会通过 ...
Hadoop MapReduce编程 API入门系列之挖掘气象数据版本3（九）
不多说,直接上干货! 下面,是版本1. Hadoop MapReduce编程 API入门系列之挖掘气象数据版本1(一) 下面是版本2. Hadoop MapReduce编程 API入门系列之挖掘气象数 ...

随机推荐

C# Winfrom常用的几个公共控件
ComboBox控件的使用方法: //首先写好查询方法,实例化对象, NationData nd = new NationData(); List<Nation> NN = new Lis ...
【CF1119D】Frets On Fire
题目大意:给定一个长度为 n 的序列,给定一个恒定的 w,求解 \[\sum\limits_{i=1}^{n}min\{d[i],w\}\] 题解:学会了对最小值和式的快速处理. 若在下标的角度考虑, ...
CF1129D Isolation（分块+DP）
一个很显然的DP方程式:f[i]=Σf[j],其中j<i且在[j+1,i]中出现1次的数不超过k个乍一看挺神仙的,只会O(n^2),就是对于每个位置从后向前扫一遍,边扫边统计出现1次的数的个数 ...
github在网页编写readme之后的操作
study from : https://jingyan.baidu.com/article/f3e34a12a25bc8f5ea65354a.html
RabbitMQ入门-队列
先建工程下一步,输入坐标下一步,输入工程名先看一下最终目录修改pom文件 <?xml version="1.0" encoding="UTF-8" ...
ECharts基础
echarts: js引用:<script type="text/javascript" src="js/echarts.js"></scri ...
3D转换（位置）+过渡+透视
效果如图: html代码: <div class="door"> <div class="in"><div> </di ...
kernel(二)源码浅析
目录 kernel(二)源码浅析建立工程启动简析 head.s 入口点查询处理器查询机器ID 启动MMU 其他操作 start_kernel 处理命令行分区 title: kernel(二) ...
CentOS7 图形化方式安装 Oracle 18c 单实例
下载 Oracle 数据库,zip 包 https://www.oracle.com/technetwork/database/enterprise-edition/downloads/index.h ...
设计模式---对象性能模式之享元模式（Flyweight）
一:概念通过与其他类似对象共享数据来减少内存占用如果一个应用程序使用了太多的对象, 就会造成很大的存储开销. 特别是对于大量轻量级 (细粒度)的对象,比如在文档编辑器的设计过程中,我们如果为每个字 ...

Hbase使用MapReduce编程导出数据到HDFS

Hbase使用MapReduce编程导出数据到HDFS的更多相关文章

随机推荐

热门专题