flink连接hbase方法及遇到的问题

1、继承 RichSinkFunction 类

　　mvn配置：

        <dependency>

            <groupId>org.apache.flink</groupId>

            <artifactId>flink-hbase_2.12</artifactId>

            <version>1.7.2</version>

        </dependency>

　　<dependency>

    <groupId>org.apache.hadoop</groupId>

    <artifactId>hadoop-client</artifactId>
    <version>2.7.3</version>
    <exclusions>
        <exclusion>
            <artifactId>xml-apis</artifactId>
            <groupId>xml-apis</groupId>
        </exclusion>
    </exclusions>
</dependency>

　　config配置：

　　flink接入config代码：

    public static void main(String[] args) throws Exception {

        /*

        Env and Config

         */

        if (args.length > 0) {

            configEnv = args[0];

        }

        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        String confName = String.format("xxx.%s.properties", configEnv);

        InputStream in = MidasCtr.class.getClassLoader().getResourceAsStream(confName);

        ParameterTool parameterTool = ParameterTool.fromPropertiesFile(in);

        env.getConfig().setGlobalJobParameters(parameterTool);

}

　　代码：　　

package midas.knowbox;

import org.apache.flink.api.java.utils.ParameterTool;

import org.apache.flink.configuration.Configuration;

import org.apache.flink.streaming.api.functions.sink.RichSinkFunction;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.TableName;

import org.apache.hadoop.hbase.client.*;

import org.apache.hadoop.hbase.util.Bytes;

public class WriteHbaseRich extends RichSinkFunction<AdDot> {

    private Connection conn = null;

    private Table table = null;

    private static String zkServer;

    private static String zkPort;

    private static TableName tableName;

    private static final String click = "click";

    BufferedMutatorParams params;

    BufferedMutator mutator;

    @Override

    public void open(Configuration parameters) throws Exception {

        ParameterTool para = (ParameterTool)

                getRuntimeContext().getExecutionConfig().getGlobalJobParameters();

        zkServer = para.getRequired("hbase.zkServer");

        zkPort = para.getRequired("hbase.zkPort");

        String tName = para.getRequired("hbase.tableName");

        tableName = TableName.valueOf(tName);

        org.apache.hadoop.conf.Configuration config = HBaseConfiguration.create();

        config.set("hbase.zookeeper.quorum", zkServer);

        config.set("hbase.zookeeper.property.clientPort", zkPort);

        conn = ConnectionFactory.createConnection(config);

        Admin admin = conn.getAdmin();

        admin.listTableNames();

        if (!admin.tableExists(tableName)) {

            HTableDescriptor tableDes = new HTableDescriptor(tableName);

            tableDes.addFamily(new HColumnDescriptor(click).setMaxVersions(3));

            System.out.println("create table");

            admin.flush(tableName);

        }

        // 连接表

        table = conn.getTable(tableName);

        // 设置缓存

        params = new BufferedMutatorParams(tableName);

        params.writeBufferSize(1024);

        mutator = conn.getBufferedMutator(params);

    }

    @Override

    public void invoke(AdDot record, Context context) throws Exception {

        Put put = new Put(Bytes.toBytes(String.valueOf(record.userID)));

        System.out.println("hbase write");

        System.out.println(record.recent10Data);

        put.addColumn(Bytes.toBytes(click),Bytes.toBytes("recent_click"),Bytes.toBytes(String.valueOf(record.toJson())));

        mutator.mutate(put);

        System.out.println("hbase write");

    }

    @Override

    public void close() throws Exception {

        mutator.flush();

        conn.close();

    }

}

　　调用：

dataStream.addSink(new WriteHbaseRich());

2、实现接口OutputFormat（不知道如何使用flink的配置文件）

package midas.knowbox;

import org.apache.flink.api.common.io.OutputFormat;

import org.apache.flink.configuration.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.TableName;

import org.apache.hadoop.hbase.client.*;

import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;

import java.util.ArrayList;

public class WriteHbase implements OutputFormat<AdDot> {

    private Connection conn = null;

    private Table table = null;

    private static String zkServer = "";

    private static String port = "2181";

    private static TableName tableName = TableName.valueOf("test");

    private static final String userCf = "user";

    private static final String adCf = "ad";

    @Override

    public void configure(Configuration parameters) {

    }

    @Override

    public void open(int taskNumber, int numTasks) throws IOException {

        org.apache.hadoop.conf.Configuration config = HBaseConfiguration.create();

        config.set("hbase.zookeeper.quorum", zkServer);

        config.set("hbase.zookeeper.property.clientPort", port);

        conn = ConnectionFactory.createConnection(config);

        Admin admin = conn.getAdmin();

        admin.listTableNames();

        if (!admin.tableExists(tableName)) {

            // 添加表描述

            HTableDescriptor tableDes = new HTableDescriptor(tableName);

            // 添加列族

            tableDes.addFamily(new HColumnDescriptor(userCf));

            tableDes.addFamily(new HColumnDescriptor(adCf));

            // 创建表

            admin.createTable(tableDes);

        }

        table = conn.getTable(tableName);

    }

    @Override

    public void writeRecord(AdDot record) throws IOException {

        Put put = new Put(Bytes.toBytes(record.userID + "_" + record.adID + "_" + record.actionTime)); // 指定行

        // 参数分别:列族、列、值

        put.addColumn(Bytes.toBytes("user"), Bytes.toBytes("uerid"), Bytes.toBytes(record.userID));

        put.addColumn(Bytes.toBytes("ad"), Bytes.toBytes("ad_id"), Bytes.toBytes(record.adID));

        table.put(put);

    }

    @Override

    public void close() throws IOException {

          conn.close()

    }

}

3、遇到的问题

　　写入hbase的时候出现包引用错误剔除 xml-apis 就好了

<dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>2.7.3</version>

            <exclusions>

                <exclusion>

                    <artifactId>xml-apis</artifactId>

                    <groupId>xml-apis</groupId>

                </exclusion>

            </exclusions>

 </dependency>

flink连接hbase方法及遇到的问题的更多相关文章

phoenix连接hbase数据库，创建二级索引报错：Error: org.apache.phoenix.exception.PhoenixIOException: Failed after attempts=36, exceptions: Tue Mar 06 10:32:02 CST 2018, null, java.net.SocketTimeoutException: callTimeou
v\:* {behavior:url(#default#VML);} o\:* {behavior:url(#default#VML);} w\:* {behavior:url(#default#VM ...
JDBC连接MySQL 方法实例及资料收集
JDBC连接MySQL 方法实例及资料收集准备工作首先,安装MySQL,配置用户名和密码,创建数据库. 可参见之前的文章: http://www.cnblogs.com/mengdd/p/315 ...
[转]配置mysql允许远程连接的方法
配置mysql允许远程连接的方法 vim /etc/my.cnf注释这一行:bind-address=127.0.0.1 ==> #bind-address=127.0.0.1保存退出.mysq ...
docker 安装 hbase安装 java连接hbase (mac环境)
docker 安装 https://hub.docker.com/editions/community/docker-ce-desktop-mac 下载地址下载完之后,安装app一样安装就好安装完 ...
全网最详细的hive-site.xml配置文件里如何添加达到Hive与HBase的集成，即Hive通过这些参数去连接HBase（图文详解）
不多说,直接上干货! 一般,普通的情况是全网最详细的hive-site.xml配置文件里添加<name>hive.cli.print.header</name>和<na ...
Oracle字符串连接的方法
Oracle数据库中,使用“||”进行字符串连接,下面就让我们一起了解一下Oracle数据库中字符串连接的方法,希望对您能有所帮助. 和其他数据库系统类似,Oracle字符串连接使用“||”进行字符串 ...
ambari安装集群下python连接hbase之安装thrift
简介: python连接hbase是需要通过thrift连进行连接的,ambari安装的服务中貌似没有自带安装hbase的thrift,我是看配置hbase的配置名称里面没有thrift,cdh版本的 ...
windows平台kettle连接hbase的问题
我本机安装的环境是centos7,并在本机上安装了zookeeper,hadoop,hbase,hive等组件, 使用pdi7.1来连接hbase,把mysql表中的数据导出到hbase中去,没有问题 ...
mysql设置指定ip远程访问连接的方法
本文实例讲述了mysql设置指定ip远程访问连接的方法,分享给大家供大家参考.具体实现方法如下: 1. 授权用户root使用密码jb51从任意主机连接到mysql服务器: 复制代码代码如下: GRA ...

随机推荐

SpringMVC配置与使用
一.MVC概要 MVC是模型(Model).视图(View).控制器(Controller)的简写,是一种软件设计规范,用一种将业务逻辑.数据.显示分离的方法组织代码,MVC主要作用是降低了视图与业务 ...
【踩坑】利用fastjson反序列化需要默认构造函数
利用 fastjson等反序列化时需要注意,他可能会用到默认的构造函数,如果没有默认构造函数,某些场景下可能会出现反序列化熟悉为空的情况,如下图所示:
mysql常用的用户授权语句
一:授权主要的 SQL //某个数据库所有的权限 ALL 后面+ PRIVILEGES GRANT ALL PRIVILEGES ON 库名.* TO '用户'@'%' IDENTIFIED BY ' ...
k8s网络之Calico网络
k8s网络主题系列: 一.k8s网络之设计与实现二.k8s网络之Flannel网络三.k8s网络之Calico网络简介 Calico 是一种容器之间互通的网络方案.在虚拟化平台中,比如 Open ...
IPv6 RIPng (PT)
在Cisco路由器上配置RIPng 一.拓扑图二.地址表 Device Interface IPv6 Address R1 F 0/0 2001:0DB8:CAFE:0001::1/64 S 0/ ...
BSON数据格式
BSON https://baike.baidu.com/item/BSON 概念编辑 BSON()是一种类json的一种二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌 ...
Java裸写爬虫技术，运用多线程技术，高效爬取某个医疗机构网站数据
最近喜欢上了数据的庞大的感觉,就爬取了一下某个医疗机构网站医疗数据,由于数据量庞大,只爬取了江西省的各个市的各个医院的各个科室的各个科室.中各种信息.其中用的持久层技术是hibernate框架,和用到 ...
「luogu4462」[CQOI2018] 异或序列
「luogu4462」[CQOI2018]异或序列一句话题意输入 \(n\) 个数,给定\(k\),共 \(m\) 组询问,输出第 \(i\) 组询问 \(l_i\) \(r_i\) 中有多少个连 ...
【转】pyhton之Reportlab模块——生成pdf文件
[转]pyhton之Reportlab模块 reportlab模块是用python语言生成pdf文件的模块安装:pip install reportlab 模块默认不支持中文,如果使用中文需要注册 ...
使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
抖音很火,楼主使用python随机爬取抖音视频,并且无水印下载,人家都说天下没有爬不到的数据,so,楼主决定试试水,纯属技术爱好,分享给大家.. 1.楼主首先使用Fiddler4来抓取手机抖音app这 ...

flink连接hbase方法及遇到的问题

flink连接hbase方法及遇到的问题的更多相关文章

随机推荐

热门专题