重写Sink合并多行

flume1.6+elasticsearch6.3.2

Pom

<dependencies>

        <dependency>

            <groupId>junit</groupId>

            <artifactId>junit</artifactId>

            <version>3.8.</version>

            <scope>test</scope>

        </dependency>

        <!-- https://mvnrepository.com/artifact/org.elasticsearch/elasticsearch -->

        <dependency>

            <groupId>org.elasticsearch</groupId>

            <artifactId>elasticsearch</artifactId>

            <version>6.4.</version>

        </dependency>

        <!-- https://mvnrepository.com/artifact/org.elasticsearch.client/transport -->

        <dependency>

            <groupId>org.elasticsearch.client</groupId>

            <artifactId>transport</artifactId>

            <version>6.4.</version>

        </dependency>

        <!-- <dependency> <groupId>io.netty</groupId> <artifactId>netty-all</artifactId>

            <version>4.1..Final</version> </dependency> -->

        <!-- https://mvnrepository.com/artifact/org.apache.flume.flume-ng-sinks/flume-ng-elasticsearch-sink -->

        <dependency>

            <groupId>org.apache.flume.flume-ng-sinks</groupId>

            <artifactId>flume-ng-elasticsearch-sink</artifactId>

            <version>1.6.</version>

        </dependency>

        <!-- https://mvnrepository.com/artifact/com.google.code.gson/gson -->

        <dependency>

            <groupId>com.google.code.gson</groupId>

            <artifactId>gson</artifactId>

            <version>2.8.</version>

        </dependency>

</dependencies>

ElasticSearchForLogSink.java

package com.jachs.sink.elasticsearch;

import org.apache.flume.Channel;

import org.apache.flume.Context;

import org.apache.flume.Event;

import org.apache.flume.EventDeliveryException;

import org.apache.flume.Transaction;

import org.apache.flume.conf.Configurable;

import org.apache.flume.sink.AbstractSink;

import org.apache.flume.sink.elasticsearch.ElasticSearchEventSerializer;

import org.apache.flume.sink.elasticsearch.client.RoundRobinList;

import org.apache.http.client.HttpClient;

import org.apache.http.impl.client.DefaultHttpClient;

import org.elasticsearch.action.bulk.BulkRequestBuilder;

import org.elasticsearch.action.index.IndexRequestBuilder;

import org.elasticsearch.action.index.IndexResponse;

import org.elasticsearch.client.transport.TransportClient;

import org.elasticsearch.common.bytes.BytesReference;

import org.elasticsearch.common.settings.Settings;

import org.elasticsearch.common.transport.TransportAddress;

import org.elasticsearch.transport.client.PreBuiltTransportClient;

import com.google.gson.Gson;

import static org.apache.flume.sink.elasticsearch.ElasticSearchSinkConstants.CLUSTER_NAME;

import static org.apache.flume.sink.elasticsearch.ElasticSearchSinkConstants.INDEX_NAME;

import java.net.InetAddress;

import java.net.UnknownHostException;

import java.util.Arrays;

import java.util.HashMap;

import java.util.Map;

import static org.apache.flume.sink.elasticsearch.ElasticSearchSinkConstants.HOSTNAMES;

public class ElasticSearchForLogSink extends AbstractSink implements Configurable {

    private String hostNames;

    private String indexName;

    private String clusterName;

    static TransportClient client;

    static Map<String, String> dataMap = new HashMap<String, String>();;

    public void configure(Context context) {

        hostNames = context.getString(HOSTNAMES);

        indexName = context.getString(INDEX_NAME);

        clusterName = context.getString(CLUSTER_NAME);

    }

    @Override

    public void start() {

        Settings settings = Settings.builder().put("cluster.name", clusterName).build();

        try {

            client = new PreBuiltTransportClient(settings).addTransportAddress(new TransportAddress(

                    InetAddress.getByName(hostNames.split(":")[]), Integer.parseInt(hostNames.split(":")[])));

        } catch (UnknownHostException e) {

            e.printStackTrace();

        }

    }

    @Override

    public void stop() {

        super.stop();

    }

    public Status process() throws EventDeliveryException {

        Status status = Status.BACKOFF;

        Channel ch = getChannel();

        Transaction txn = ch.getTransaction();

        txn.begin();

        try {

            Event event = ch.take();

            if (event == null) {

                txn.rollback();

                return status;

            }

            String data = new String(event.getBody(), "UTF-8");

            if (data.indexOf("token") != -) {

                String token = data.substring(data.length() - , data.length());

                System.out.println("获取标识" + token);

                String sb = dataMap.get(token);

                if (sb != null) {

                    sb = sb + data;

                } else {

                    dataMap.put(token, data);

                }

            }

            System.out.println("打印" + dataMap.size());

            if (dataMap.size() >= ) {//十条数据一提交,条件自己改

                BulkRequestBuilder bulkRequest = client.prepareBulk();

                bulkRequest.add(client.prepareIndex(indexName, "text").setSource(dataMap));

                bulkRequest.execute().actionGet();

                dataMap.clear();

                System.out.println("归零" + dataMap.size());

            }

            // Map<String, Object> map = new HashMap<String, Object>();

            // for (String key : head.keySet()) {

            // map.put("topic", key);

            // map.put("timestamp", head.get(key));

            // map.put("data", new String(event.getBody(), "UTF-8"));

            // }

            // IndexRequestBuilder create = client.prepareIndex(indexName,

            // "text").setSource(map);

            // IndexResponse response = create.execute().actionGet();

            txn.commit();

            status = Status.READY;

        } catch (Throwable t) {

            txn.rollback();

            status = Status.BACKOFF;

            t.printStackTrace();

            if (t instanceof Error) {

                throw (Error) t;

            }

        } finally {

            txn.close();

        }

        return status;

    }

}

kafka生成者模仿日志写入代码

package com.test.Kafka;

import java.util.Properties;

import org.apache.commons.lang.RandomStringUtils;

import org.apache.commons.lang.StringUtils;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.Producer;

import org.apache.kafka.clients.producer.ProducerRecord;

import com.google.gson.Gson;

public class App {

    public static void main(String[] args) {

        Properties properties = new Properties();

        // properties.put("bootstrap.servers",

        // "192.168.2.200:9092,192.168.2.157:9092,192.168.2.233:9092,192.168.2.194:9092,192.168.2.122:9092");

        // properties.put("bootstrap.servers",

        // "192.168.2.200:9092,192.168.2.233:9092,192.168.2.122:9092");

        properties.put("bootstrap.servers", "127.0.0.1:9092");

        properties.put("acks", "all");

        properties.put("retries", );

        properties.put("batch.size", );

        properties.put("linger.ms", );

        properties.put("buffer.memory", );

        properties.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        properties.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        Producer<String, String> producer = null;

        RandomStringUtils randomStringUtils=new RandomStringUtils();

        try {

            producer = new KafkaProducer<String, String>(properties);

            for (int i = ; i < ; i++) {// topID无所谓

                producer.send(new ProducerRecord<String, String>("test1", "tokenk"+randomStringUtils.random()));

            }

        } catch (Exception e) {

            e.printStackTrace();

        } finally {

            producer.close();

        }

    }

}

修改flume配置

a1.sinks.elasticsearch.type=com.jachs.sink.elasticsearch.ElasticSearchForLogSink

重写Sink合并多行的更多相关文章

jquery动态合并表格行
利用<td rowspan = "num"/>;原理来实现,其中num为要合并的行数. <!DOCTYPE html> <html> <h ...
Js 合并 table 行的实现方法
Js 合并 table 行的实现方法需求如下: 某公司的员工档案,如下, 经理看员工的信息不是很清晰: 姓名所在学校毕业时间张三小学 2000 张三中学 2006 张三大学 2010 ...
SQL中合并多行记录的方法总汇
-- =============================================================================-- Title: 在SQL中分类合并数 ...
C# 使用Epplus导出Excel [4]：合并指定行
C# 使用Epplus导出Excel [1]:导出固定列数据 C# 使用Epplus导出Excel [2]:导出动态列数据 C# 使用Epplus导出Excel [3]:合并列连续相同数据 C# 使用 ...
【HANA系列】SAP HANA SQL合并多行操作
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列]SAP HANA SQL合并多行 ...
合并表格行---三层for循环遍历数据
合并表格行---三层for循环遍历数据示例1 json <!DOCTYPE html> <html lang="zh_cn"> <head> ...
详细说明svn分支与合并---命令行
一,svn分支与合并有什么用? 作程序的,对svn在熟悉不过了,但对svn分支熟悉的,我想并不多.因为一般情况下,是用不着svn分支的,其实也没有那个必要.下面我例举几个需要用到svn分支的情况: 1 ...
html表格合并（行，一排）
<table> <tr> <td colspan="2">失败的例子:</td> </tr> {% for ip , j ...
SQL SERVER 字符合并多行为一列
[字符合并多行为一列] 思路1:行转列,在与字符拼接(适用每组列数名相同) 思路2:转xml,去掉多余字符(适用所有) 假设兴趣表Hobbys Name Hobby 小张打篮球小张踢足球 Nam ...

随机推荐

springcloud~配置中心的使用
配置中心作为springcloud里最底层的框架,所发挥的意思是举足轻重的,所以的组件的配置信息都可以通过springcloud config来管理,它会把配置信息分布式的存储到git上,所以信息安全 ...
vue.js移动端配置flexible.js
前言最近在用vue做移动端项目,网上找了一些移动端适配的方案,个人觉得手淘团队flexible.js还是比较容易上手,在这里做下总结. 主体 flexible.js适配方案采用rem布局,根据屏幕分 ...
【带着canvas去流浪（8）】碰撞
目录一. canvas的能力二. 动画框架三. 在canvas中模拟碰撞 3.1定义小球的属性 3.2 生成新的小球 3.3 帧动画绘制函数step 3.4 定义小球的update方法 3.5 ...
Window环境下搭建Git服务器
如果公司要搭建自己的 Git 服务器,可以使用 gitblit 这个开源的 Git 服务器下载gitblit安装包到 http://gitblit.com/下载安装包解压缩下载的压缩包即可,无需 ...
数据结构系列（2）之 AVL 树
本文将主要讲解平衡二叉树中的 AVL 树,其中将重点讲解二叉树的重平衡方法,即左旋和右旋,以及 3+4 重构:这些方法都是后面要讲的 B 树,红黑树等 BBST 的重要基础:此外在看本文之前最好先看一 ...
Docker最全教程之Ubuntu下安装Docker（十四）
前言 Ubuntu是一个以桌面应用为主的开源GNU/Linux操作系统,应用很广.本篇主要讲述Ubuntu下使用SSH远程登录并安装Docker,并且提供了Docker安装的两种方式,希望对大家有所帮 ...
C#中的CultureInfo类
CultureInfo类位于System.Globalization命名空间内,这个类和命名空间许多人都不是很熟悉,实际我们在写程序写都经常间接性的接触这个类,当进行数字,日期时间,字符串匹配时,都会 ...
mysql 盲注二分法python脚本
import urllib import urllib2 def doinject(payload): url = 'xxxxxxxxxxxxxxxxxxxxx' values = {'injecti ...
DataTable克隆行
DataRow Adr = ds.Tables[].NewRow(); Adr.ItemArray = (].Rows[].ItemArray.Clone(); ds.Tables[].Rows.Ad ...
Ext.isIterable
Ext.isIterable用于判断传入的参数是否为可迭代的在这4种情况下,函数返回true 1:数组2:函数参数arguments3:HTML collections : NodeList4:HT ...

重写Sink合并多行

重写Sink合并多行的更多相关文章

随机推荐

热门专题