flume+kafka (分区实现默认单分区) （二）

这篇文章主要在上一篇文章的基础上讲一下如何自定义flume到kafka的分区

上一节中从下面的地址下载了一个源码

https://github.com/beyondj2ee/flumeng-kafka-plugin/tree/master/

我们只是从中获取了jar包。这次我们就利用下载的源码去自定义分区

把源码通过mvn eclipse:eclipse 转变为普通java项目导到eclipse中结构如上图

上节讲的SimglePartition已经标出，源码如下

public class SinglePartition implements Partitioner<String> {

private static final Logger LOGGER = LoggerFactory.getLogger(SinglePartition.class);

public SinglePartition(VerifiableProperties props) {
}

@Override
    public int partition(String key, int numberOfPartions) {

        return 0;
    }

}

我们把这个文件复制改名为ManyPartition 修改源码中绿线标示的位置即可

我的修改源码如下

public class ManyPartition implements Partitioner<String> {
// - [ constant fields ] ----------------------------------------

/**
     * The constant LOGGER.
     */
    private static final Logger LOGGER = LoggerFactory.getLogger(ManyPartition.class);

private int count = 0;
public ManyPartition(VerifiableProperties props) {
}

@Override
    public int partition(String key, int numberOfPartions) {
       return new Random().nextInt(numberOfPartions);
    }

}

然后通过 mvn clean package 重新编译会重新生成flumeng-kafka-plugin.jar 然后把此jar包替换flume/lib/下的同名jar包就可使用自定义分区类

而上一节中提到的配置文件中的producer.sinks.r.partition.key=4 实际上没有多大的作用

他对应源码中KafkaSink类的process()方法中的代码入下图标出所示

实际传入不传入这个partititonId没有任何区别因为即使传入ParitionId 也是一个固定值因此没有办法依照这个Id进行分区

flume+kafka (分区实现默认单分区) （二）的更多相关文章

flume+kafka (分区实现默认单分区)
这篇文章主要是log4j+flume+kafka的内容首先从从下面的地址下载flume+kafka的插件包 https://github.com/beyondj2ee/flumeng-kafka-p ...
mac系统之前做过Windows8系统，可能移除时没有通过boot camp助理移除，所以想要再安装windows系统时，点击boot camp助理的继续，弹出启动磁盘不能被分区或恢复单分区。
因为把bootcamp分区抹掉,卸载,装载,点减号,合并成单分区,一直是操作失败.为了通过boot camp安装上Windows系统,索性重新安装mac ox系统,重新分区.重新开机,按住comman ...
Kafka 生产者、消费者与分区的关系
背景最近和海康整数据对接, 需要将海康产生的结构化数据拿过来做二次识别. 基本的流程: 海康大数据 --> kafka server --> 平台 Kafka 的 topic 正常过车 ...
4种Kafka网络中断和网络分区场景分析
摘要:本文主要带来4种Kafka网络中断和网络分区场景分析. 本文分享自华为云社区<Kafka网络中断和网络分区场景分析>,作者: 中间件小哥. 以Kafka 2.7.1版本为例,依赖zk ...
详解Centos默认磁盘分区
对于有经验的Linux系统管理员,在安装系统之前都会对系统的分区进行规划:针对这一需求,下面就通过默认的Centos分区与大家分享一些关于Linux系统的知识.Linux系统的磁盘命名规范:硬盘类型标 ...
Centos7不修改默认交换分区下添加交换分区
交换分区介绍 Linux系统中的交换分区是当物理内存(RAM)被充满时,作为物理内存的缓存来使用. 当系统需要更多的内存资源而物理内存已经充满,内存中不活跃的页就会被移动到交换分区上. 交换分区位于硬 ...
Oracle Spatial分区应用研究之二：按县分区与按省分区对比测试报告
1.实验目的在上一轮的实验中,oracle 11g r2版本下,在87县市实验数据的基础上,比较了分表与分区的效率,得出了分区+全局索引效率较高的结论(见上一篇博客).不过我们尚未比较过不同的分区粒 ...
hadoop 之 kafka 安装与 flume -> kafka 整合
62-kafka 安装 : flume 整合 kafka 一.kafka 安装 1.下载 http://kafka.apache.org/downloads.html 2. 解压 tar -zxvf ...
Kafka入门学习随记（二）
====Kafka消费者模型参考博客:http://www.tuicool.com/articles/fI7J3m --分区消费模型分区消费架构图图中kafka集群有两台服务器(Server), ...

随机推荐

【windows socket+TCPserverclient】
Windows Socket+TCPserverclient Winsock是 Windows下套接字标准. Socket套接字基于计算机网络,提供同一系统上不同进程或由局 ...
C语言中的各种修饰符
C允许同时使用多于一个的修饰符,这就使得可以创建一下各种类型: int board[8][8];//int数组的数组 int **ptr;//指向int的指针的指针 int *risk[10];//具 ...
Foxit Reader 插件下载
http://www.foxitsoftware.com/Secure_PDF_Reader/addons.php#install 百度云:http://pan.baidu.com/s/1i3DSlv ...
解决vim中鼠标右键无法复制的问题
转:http://www.cnblogs.com/jianyungsun/archive/2011/03/19/1988855.html 这是我的vim配置文件:jeffy-vim-v2.4.tar ...
A SQLite client library written in Modern C++
smartdb是一个纯c++11开发,header-only,简洁高效的sqlite封装库. github地址:https://github.com/chxuan/smartdb,如果您觉得不错,请不 ...
Hadoop从2.2.0到2.7
Hadoop2.2.0 GA release 通用版本,Hadoop2.2.0就是一个通用版本 Hadoop2.2.0是从Hadoop1.1.0升级过来的,增加了以下特性: 1.增加了YARN: 2. ...
BOM/ROUTING/PO/WIP等模块常用查询
常用查询scripts /*bom*/ select p_item.segment1,c_item.segment1,bic.COMPONENT_QUANTITY,bic.COMPONENT_YIEL ...
剑指Offer36 数字在排序数组中出现的次数
/************************************************************************* > File Name: 36_Number ...
转：自建CDN防御DDoS（1， 2， 3）infoq
本文中提到的要点: 1. 针对恶意流的应对方法与策略.(基本上,中级的,顶级的) 2. IP分类的脚本 3. 前端proxy工具的选择与使用. 4. 开源日志系统的选择与比较. (http:/ ...
【转】唱吧CEO陈华：创业四年，我积累的7点管理经验
现象级产品“唱吧”至今拥有令人羡慕的用户数量,3亿.而这一切,却用了短短不到四年时间.唱吧团队如何应对越来越复杂的市场变化:怎样用人,才能不断激励新老员工做出更棒的业绩:CEO陈华又如何用“下大雪”模 ...

flume+kafka (分区实现 默认单分区) （二）

flume+kafka (分区实现 默认单分区) （二）的更多相关文章

随机推荐

热门专题

flume+kafka (分区实现默认单分区) （二）

flume+kafka (分区实现默认单分区) （二）的更多相关文章