Hbase篇--Hbase和MapReduce结合Api

一.前述

Mapreduce可以自定义Inputforma对象和OutPutformat对象，所以原理上Mapreduce可以和任意输入源结合。

二.步骤

将结果写会到hbase中去。

2.1 Main函数

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

/**

 * 分析hdfs 文本  统计单词数量

 * 结果输出到 hbase表

 * create 'wc','cf'

 * rowkey: 单词        cf:count=单词数量

 * @author root

 *

 */

public class WCDemo {

    /**

     *

     * wc

     * 数据hbase表    rowkey  cell存放文本

     * 结果输出到 hbase表

     *

     */

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://node1:8020");//设置hdfs集群nameservices名称

        conf.set("hbase.zookeeper.quorum", "node4");

        Job job = Job.getInstance(conf);

        job.setJarByClass(WCDemo.class);

        job.setMapperClass(WCMapper.class);

        job.setMapOutputKeyClass(Text.class);

        job.setMapOutputValueClass(IntWritable.class);

//        job.setReducerClass();

        //addDependencyJars  本地方式运行： 设置为false

//        TableMapReduceUtil.initTableReducerJob("wc", WCReducer.class, job);

        TableMapReduceUtil.initTableReducerJob("wc",WCReducer.class, job,

                null, null, null, null, false);

        Path path = new Path("/user/wc");

        FileInputFormat.addInputPath(job, path);

        boolean flag = job.waitForCompletion(true);

        if(flag) {

            System.out.println("success~~");

        }

    }

}

2.2 Mapper函数（和正常的Mapper没啥区别）

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

public class WCMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

    @Override

    protected void map(LongWritable key, Text value, Context context)

            throws IOException, InterruptedException {

        String[] words = value.toString().split(" ");

        for (String w : words) {

            context.write(new Text(w), new IntWritable(1));

        }

    }

}

2.3 Reduce函数（主要是把Put对象写出去）

import java.io.IOException;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

import org.apache.hadoop.hbase.mapreduce.TableReducer;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

public class WCReducer extends

        TableReducer<Text, IntWritable, ImmutableBytesWritable> {

    @Override

    protected void reduce(Text text, Iterable<IntWritable> iterable,

            Context context) throws IOException, InterruptedException {

        int sum = 0;

        for (IntWritable i : iterable) {

            sum += i.get();

        }

        Put put = new Put(text.toString().getBytes());

        put.add("cf".getBytes(), "count".getBytes(), (sum+"").getBytes());

        context.write(null, put);

    }

}

Hbase篇--Hbase和MapReduce结合Api的更多相关文章

HBase篇--HBase常用优化
一.前述 HBase优化能够让我们对调优有一定的理解,当然企业并不是所有的优化全都用,优化还要根据业务具体实施. 二.具体优化 1.表的设计 1.1 预分区默认情况下,在创建HBase表的时候会自 ...
HBase篇--HBase操作Api和Java操作Hbase相关Api
一.前述. Hbase shell启动命令窗口,然后再Hbase shell中对应的api命令如下. 二.说明 Hbase shell中删除键是空格+Ctrl键. 三.代码 1.封装所有的API pa ...
Hbase篇--HBase中一对多和多对多的表设计
一.前述今天分享一篇关于HBase的一对多和多对多的案例的分析. 二.具体案例案例一.多对多人员-角色人员有多个角色角色优先级角色有多个人员人员删除添加角色角 ...
Hbase理论&&hbase shell&&python操作hbase&&python通过mapreduce操作hbase
一.Hbase搭建: 二.理论知识介绍: 1Hbase介绍: Hbase是分布式.面向列的开源数据库(其实准确的说是面向列族).HDFS为Hbase提供可靠的底层数据存储服务,MapReduce为Hb ...
HBase、HDFS和MapReduce架构异同简解
HBase.HDFS和MapReduce架构异同 .. HBase(公司架构模型) HDFS2.0(公司架构模型) MR2.0(公司架构模型) MR1.0(公司架构模型) 中央 HMaster Nam ...
HBase操作（Shell与Java API）
版权声明:本文为博主原创文章,未经博主允许不得转载. 转: http://blog.csdn.net/u013980127/article/details/52443155 下面代码在Hado ...
Hbase总结（一）-hbase命令,hbase安装,与Hive的区别,与传统数据库的区别,Hbase数据模型
Hbase总结(一)-hbase命令下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称命令表达式创建表 create '表名称', ...
Hbase系列-Hbase简介
自1970年以来,关系数据库用于数据存储和维护有关问题的解决方案.大数据的出现后,好多公司实现处理大数据并从中受益,并开始选择像 Hadoop 的解决方案.Hadoop使用分布式文件系统,用于存储大数 ...
大数据技术之_11_HBase学习_01_HBase 简介+HBase 安装+HBase Shell 操作+HBase 数据结构+HBase 原理
第1章 HBase 简介1.1 什么是 HBase1.2 HBase 特点1.3 HBase 架构1.3 HBase 中的角色1.3.1 HMaster1.3.2 RegionServer1.3.3 ...

随机推荐

html_Dom
Document: 每个载入浏览器的HTML文档都会成为一个Document对象. Document 对象使我们可以从脚本中对 HTML 页面中的所有元素进行访问. 并且Document 对象是 Wi ...
git clean 删除忽略文件和未被跟踪文件及文件夹
git clean 删除忽略文件和未被跟踪文件及文件夹概念首先我们需要认清忽略的文件和未被跟踪的文件忽略的文件:.gitignore 中忽略的文件未被跟踪的文件:没有被忽略,但是还没 ...
H5唤醒app，第三方开源库
在微信浏览器内,安卓打开应用宝,ios跳进appstore,基本都可以成功在外部浏览器内,已安装可进入应用内,未安装进入应用宝提示下载,需客户端支持.<!DOCTYPE html> < ...
linux 访问到对应的接口
8080端口已经打开. 8080端口已被监听 telnet 192.168.163.128 8080 成功也可以将防火墙关闭,这样所有的接口已经开放,不会再被拦截.这种情况下只要8080端口被某 ...
小程序即时聊天（仅页面功能，未接websocket）
我们都知道小程序是不能直接操作dom的,所以做即时通讯聊天功能的时候也就不能像之前做的一样:点击发送的时候,拼接一个节点到页面上.话不多说,以下是效果和代码: -------------------- ...
Java 扫描实现 Ioc 动态注入，过滤器根据访问url调用自定义注解标记的类及其方法
扫描实现 Ioc 动态注入参考: http://www.private-blog.com/2017/11/16/java-%e6%89%ab%e6%8f%8f%e5%ae%9e%e7%8e%b0-i ...
CAGradientLayer简介实现颜色渐变
CAGradientLayer使用: CAGradientLayer*gradient = [CAGradientLayerlayer]; gradient.frame = subLayer.fram ...
Y1O001波分复用器
# 波分复用器## 光分波器### 波分合波器种类* 耦合型 * 光纤熔融拉锥 * 熔融拉锥法是指将两根(或两根以上)除去涂覆层的光纤以一定的方法靠拢,在高温加热下熔融,同时向两侧拉伸,最终在加热区形 ...
Hbase 技术细节笔记（下）
原文地址:https://cloud.tencent.com/developer/article/1006044 四.RegionServer的故障恢复我们知道,RegionServer的相关信 ...
asp.net 跨域请求
微软官方文档 https://docs.microsoft.com/zh-cn/aspnet/core/security/cors?view=aspnetcore-2.2

Hbase篇--Hbase和MapReduce结合Api

Hbase篇--Hbase和MapReduce结合Api的更多相关文章

随机推荐

热门专题