Hbase使用MapReduce编程导出数据到HDFS

废话少说，直接上代码！

package cn.com.oozie.demo;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class HbaseExportHtable {

   public static class HbaseMapper extends TableMapper<Text, Text> {
       @Override
       public void map(ImmutableBytesWritable row, Result values,
               Context context) throws IOException {
           StringBuilder sb = new StringBuilder();
           String str = "&&";
           for (KeyValue keyValue : values.raw()) {
               sb.append(new String(keyValue.getValue())).append(str);
           }

           try {
               context.write(new Text(row.get()),
                       new Text(sb.substring(0, sb.length()-2)));
           } catch (InterruptedException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           }

       }
   }

   public static class HbaseReducer

   extends Reducer<Text, Text, NullWritable, Text> {


       public void reduce(Text key, Iterable<Text> values, Context context) {
           Text result = new Text();
           StringBuilder sb = new StringBuilder();
           String str = "&&";
           for (Text text : values) {
               result = text;
           }
       result=new Text(sb.append(key.toString()).append(str).append(result.toString()).toString());
           try {
               context.write(NullWritable.get(), result);
           } catch (IOException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           } catch (InterruptedException e) {
               // TODO Auto-generated catch block
               e.printStackTrace();
           }
       }
   }

   public static void main(String[] args) throws IOException,
           ClassNotFoundException, InterruptedException {
       Configuration conf = HBaseConfiguration.create();
       /*conf.set("hbase.zookeeper.property.clientPort", "2181");
       conf.set("hbase.zookeeper.quorum",
               "hadoop-master-node,hadoop-slave1-node,hadoop-slave2-node");
       conf.set("user.name", "hadoop");
       conf.set("groups.name", "hadoop");
       conf.set("mapred.job.tracker", "hadoop-master-node:8021");*/
       Job job = new Job(conf, "HbaseExportHtable");
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(NullWritable.class);
       job.setReducerClass(HbaseReducer.class);
       job.setJarByClass(HbaseExportHtable.class);
       Scan scan = new Scan();
       TableMapReduceUtil.initTableMapperJob("phone_http_log", scan, HbaseMapper.class,
               Text.class, Text.class, job);
       FileOutputFormat.setOutputPath(job, new Path(
               "hdfs://hadoop-master:8020/user/oozie/outputdir"));
       System.exit(job.waitForCompletion(true) ? 0 : 1);
   }
}

按照列族遍历，导出数据到文本！

Hbase使用MapReduce编程导出数据到HDFS的更多相关文章

sqoop导出数据|Hive|HDFS和脚本编写
导出数据在Sqoop中,“导出”概念指:从大数据集群(HDFS,HIVE,HBASE)向非大数据集群(RDBMS)中传输数据,叫做:导出,即使用export关键字. HIVE/HDFS到RDBMS ...
使用MapReduce将mysql数据导入HDFS
package com.zhen.mysqlToHDFS; import java.io.DataInput; import java.io.DataOutput; import java.io.IO ...
【原创】MapReduce备份Elasticsearch数据到HDFS(JAVA)
一.环境:JAVA8,Elasticsearch-5.6.2,Hadoop-2.8.1二.实现功能:mapreduce读elasticsearch数据.输出parquet文件.多输出路径三.主要依赖 ...
Hadoop之——HBASE结合MapReduce批量导入数据
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/46463889 废话不多说.直接上代码,你懂得 package hbase; imp ...
Excel导出数据Excel.Application组件权限设置方法
很多网络应用系统都会涉及到数据采用Excel方式导出的模块,部分朋友问我到底怎么弄,其实方式很多种,目前比较优秀的方式还是直接用Excel的Excel.Application方式比较合适. 采用Exc ...
HBase结合MapReduce批量导入（HDFS中的数据导入到HBase）
HBase结合MapReduce批量导入 package hbase; import java.text.SimpleDateFormat; import java.util.Date; import ...
hive和hbase本质区别——hbase本质是OLTP的nosql DB，而hive是OLAP 底层是hdfs，需从已有数据库同步数据到hdfs;hive可以用hbase中的数据，通过hive表映射到hbase表
对于hbase当前noSql数据库的一种,最常见的应用场景就是采集的网页数据的存储,由于是key-value型数据库,可以再扩展到各种key-value应用场景,如日志信息的存储,对于内容信息不需要完 ...
《OD大数据实战》HBase整合MapReduce和Hive
一.HBase整合MapReduce环境搭建 1. 搭建步骤1)在etc/hadoop目录中创建hbase-site.xml的软连接.在真正的集群环境中的时候,hadoop运行mapreduce会通过 ...
Hadoop MapReduce编程 API入门系列之挖掘气象数据版本3（九）
不多说,直接上干货! 下面,是版本1. Hadoop MapReduce编程 API入门系列之挖掘气象数据版本1(一) 下面是版本2. Hadoop MapReduce编程 API入门系列之挖掘气象数 ...

随机推荐

（转）轻松学，Java 中的代理模式及动态代理
背景:讲到反射机制,肯定会想到动态代理. 轻松学,Java 中的代理模式及动态代理代理模式可以在不修改被代理对象的基础上,通过扩展代理类,进行一些功能的附加与增强.值得注意的是,代理类和被代理类应该 ...
（六）Oracle 的 oracle表查询关键字
参考:http://www.hechaku.com/Oracle/oracle_tables2.html 1.使用逻辑操作符号问题:查询工资高于500或者是岗位为manager的雇员,同时还要满足他们 ...
Django（十九）Ajax全套
参考博客:http://www.cnblogs.com/wupeiqi/articles/5703697.html 提交: - Form - Ajax 一.Ajax,偷偷向后台发请求 - XMLHtt ...
R: 修改镜像、bioconductor安装及go基因富集分析
1.安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirr ...
Java实现二叉树的前序、中序、后序、层序遍历（非递归方法）
在上一篇博客中,实现了Java中二叉树的四种遍历方式的递归实现,接下来,在此实现Java中非递归实现二叉树的前序.中序.后序.层序遍历,在非递归实现中,借助了栈来帮助实现遍历.前序和中序比较类似, ...
Unity 摄像机跟随
方式一:将摄像机直接拖到游戏对象的下面: 方式二:脚本实现 using System.Collections; using System.Collections.Generic; using Unit ...
(最小生成树 Prim) nyoj1403-沟通无限校园网
题目描述: 校园网是为学校师生提供资源共享.信息交流和协同工作的计算机网络.校园网是一个宽带.具有交互功能和专业性很强的局域网络.如果一所学校包括多个学院及部门,也可以形成多个局域网络,并通过有线或无 ...
Mac上深色模式下的精美炫酷软件
针对发布的 macOS Mojave 10.14 系统中,最大的改变就是引入了深色模式,尤其对技术开发人员来说非常实用,非常的酷! 深色模式使用一种较深的配色方案,这种配色作用于整个系统,包括 Mac ...
Vue computed属性
computed vs methods 我们可以使用Vue中的method计算出学科的总分,最终得到的总数结果是相同的. 在上例的基础上,我们把computed区块中的totalMarks函数整体移到 ...
剑指Offer_编程题_4
题目描述输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树.假设输入的前序遍历和中序遍历的结果中都不含重复的数字.例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7, ...

Hbase使用MapReduce编程导出数据到HDFS

Hbase使用MapReduce编程导出数据到HDFS的更多相关文章

随机推荐

热门专题