一、Kafka集群环境

1、环境版本

版本：kafka2.11，zookeeper3.4

注意：这里zookeeper3.4也是基于集群模式部署。

2、解压重命名

tar -zxvf kafka_2.11-0.11.0.0.tgz

mv kafka_2.11-0.11.0.0 kafka2.11

创建日志目录

[root@en-master kafka2.11]# mkdir logs

注意：以上操作需要同步到集群下其他服务上。

3、添加环境变量

vim /etc/profile

export KAFKA_HOME=/opt/kafka2.11

export PATH=$PATH:$KAFKA_HOME/bin

source /etc/profile

4、修改核心配置

[root@en-master /opt/kafka2.11/config]# vim server.properties

-- 核心修改如下

# 唯一编号

broker.id=0

# 开启topic删除

delete.topic.enable=true

# 日志地址

log.dirs=/opt/kafka2.11/logs

# zk集群

zookeeper.connect=zk01:2181,zk02:2181,zk03:2181

注意：broker.id安装集群服务个数编排即可，集群下不能重复。

5、启动kafka集群

# 启动命令

[root@node02 kafka2.11]# bin/kafka-server-start.sh -daemon config/server.properties

# 停止命令

[root@node02 kafka2.11]# bin/kafka-server-stop.sh

# 进程查看

[root@node02 kafka2.11]# jps

注意：这里默认启动了zookeeper集群服务，并且集群下的kafka分别启动。

6、基础管理命令

创建topic

bin/kafka-topics.sh --zookeeper zk01:2181 \

--create --replication-factor 3 --partitions 1 --topic one-topic

参数说明：

replication-factor 定义副本个数
partitions 定义分区个数
topic：定义topic名称

查看topic列表

bin/kafka-topics.sh --zookeeper zk01:2181 --list

修改topic分区

bin/kafka-topics.sh --zookeeper zk01:2181 --alter --topic one-topic --partitions 5

查看topic

bin/kafka-topics.sh --zookeeper zk01:2181 \

--describe --topic one-topic

发送消息

bin/kafka-console-producer.sh \

--broker-list 192.168.72.133:9092 --topic one-topic

消费消息

bin/kafka-console-consumer.sh \

--bootstrap-server 192.168.72.133:9092 --from-beginning --topic one-topic

删除topic

bin/kafka-topics.sh --zookeeper zk01:2181 \

--delete --topic first

7、Zk集群用处

Kafka集群中有一个broker会被选举为Controller，Controller依赖Zookeeper环境，管理集群broker的上下线，所有topic的分区副本分配和leader选举等工作。

二、消息拦截案例

1、拦截器简介

Kafka中间件的Producer拦截器主要用于实现消息发送的自定义控制逻辑。用户可以在消息发送前以及回调逻辑执行前有机会对消息做一些自定义，比如消息修改等，发送状态监控等，用户可以指定多个拦截器按顺序执行拦截。

核心方法

configure：获取配置信息和初始化数据时调用；
onSend：消息被序列化以及和计算分区前调用该方法，可以对消息做操作；
onAcknowledgement：消息发送到Broker之后，或发送过程失败时调用；
close：关闭拦截器调用，执行一些资源清理工作；

注意：这里说的拦截器是针对消息发送流程。

2、自定义拦截

定义方式：实现ProducerInterceptor接口即可。

拦截器一：在onSend方法中，对拦截的消息进行修改。

@Component

public class SendStartInterceptor implements ProducerInterceptor<String, String> {

    private final Logger LOGGER = LoggerFactory.getLogger("SendStartInterceptor");

    @Override

    public void configure(Map<String, ?> configs) {

        LOGGER.info("configs...");

    }

    @Override

    public ProducerRecord<String, String> onSend(ProducerRecord<String, String> record) {

        // 修改消息内容

        return new ProducerRecord<>(record.topic(), record.partition(),

                                    record.timestamp(), record.key(),

                              "onSend：{" + record.value()+"}");

    }

    @Override

    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {

        LOGGER.info("onAcknowledgement...");

    }

    @Override

    public void close() {

        LOGGER.info("SendStart close...");

    }

}

拦截器二：在onAcknowledgement方法中，判断消息是否发送成功。

@Component

public class SendOverInterceptor implements ProducerInterceptor<String, String> {

    private final Logger LOGGER = LoggerFactory.getLogger("SendOverInterceptor");

    @Override

    public void configure(Map<String, ?> configs) {

        LOGGER.info("configs...");

    }

    @Override

    public ProducerRecord<String, String> onSend(ProducerRecord<String, String> record) {

        LOGGER.info("record...{}", record.value());

        return record ;

    }

    @Override

    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {

        if (exception != null){

            LOGGER.info("Send Fail...exe-msg",exception.getMessage());

        }

        LOGGER.info("Send success...");

    }

    @Override

    public void close() {

        LOGGER.info("SendOver close...");

    }

}

加载拦截器：基于一个KafkaProducer配置Bean，加入拦截器。

@Configuration

public class KafkaConfig {

    @Bean

    public Producer producer (){

        Properties props = new Properties();

        // 省略其他配置...

        // 添加拦截器

        List<String> interceptors = new ArrayList<>();

        interceptors.add("com.kafka.cluster.interceptor.SendStartInterceptor");

        interceptors.add("com.kafka.cluster.interceptor.SendOverInterceptor");

        props.put(ProducerConfig.INTERCEPTOR_CLASSES_CONFIG, interceptors);

        return new KafkaProducer<>(props) ;

    }

}

3、代码案例

@RestController

public class SendMsgWeb {

    @Resource

    private KafkaProducer<String,String> producer ;

    @GetMapping("/sendMsg")

    public String sendMsg (){

        producer.send(new ProducerRecord<>("one-topic", "msgKey", "msgValue"));

        return "success" ;

    }

}

基于上述自定义Bean类型，进行消息发送，关注拦截器中打印日志信息。

三、Kafka存储分析

说明：该过程基于上述案例producer.send方法追踪的源码执行流程，源码中的过程相对清楚，涉及的核心流程如下。

1、消息生成过程

Producer发送消息采用的是异步发送的方式,消息发送过程如下：

Producer发送消息之后，经过拦截器，序列化，事务判断；
流程执行后，消息内容放入容器中；
容器在指定时间内如果装满(size),会唤醒Sender线程;
容器如果在指定时间内没有装满，也会执行一次Sender线程唤醒；
唤醒Sender线程之后，把容器数据拉取到topic中；

絮叨一句：读这些中间件的源码，不仅能开阔思维，也会让自己意识到平时写的代码可能真的叫搬砖。

2、存储机制

Kafka中消息是以topic进行标识分类，生产者面向topic生产消息，topic分区(partition)是物理上的存储，基于消息日志文件的方式。

每个partition对应于一个log文件,发送的消息不断追加到该log文件末端；
log文件中存储的就是producer生产的消息数据，采用分片和索引机制；
partition分为多个segment。每个segment对应两个(.index)和(.log)文件；
index文件类型存储的索引信息；
log文件存储消息的数据；
索引文件中的元数据指向对应数据文件中message的物理偏移地址；
消费者组中的每个消费者，都会实时记录消费的消息offset位置；
当然消息消费出错时，恢复是从上次的记录位置继续消费；

3、事务控制机制

Kafka支持消息的事务控制

Producer事务

跨分区跨会话的事务原理，引入全局唯一的TransactionID，并将Producer获得的PID和TransactionID绑定。Producer重启后可以通过正在进行的TransactionID获得原来的PID。

Kafka基于TransactionCoordinator组件管理Transaction，Producer通过和TransactionCoordinator交互获得TransactionID对应的任务状态。TransactionCoordinator将事务状态写入Kafka的内部Topic，即使整个服务重启，进行中的事务状态可以得到恢复。

Consumer事务

Consumer消息消费，事务的保证强度很低，无法保证消息被精确消费，因为同一事务的消息可能会出现重启后已经被删除的情况。

四、源代码地址

GitHub·地址

https://github.com/cicadasmile/data-manage-parent

GitEE·地址

https://gitee.com/cicadasmile/data-manage-parent

推荐关联阅读：数据源管理系列

序号	标题
01	数据源管理：主从库动态路由，AOP模式读写分离
02	数据源管理：基于JDBC模式，适配和管理动态数据源
03	数据源管理：动态权限校验，表结构和数据迁移流程
04	数据源管理：关系型分库分表，列式库分布式计算
05	数据源管理：PostGreSQL环境整合，JSON类型应用
06	数据源管理：基于DataX组件，同步数据和源码分析
07	数据源管理：OLAP查询引擎，ClickHouse集群化管理

数据源管理 | Kafka集群环境搭建，消息存储机制详解的更多相关文章

kafka 集群环境搭建 java
简单记录下kafka集群环境搭建过程, 用来做备忘录安装第一步: 点击官网下载地址 http://kafka.apache.org/downloads.html 下载最新安装包第二步: 解压 t ...
大数据 -- zookeeper和kafka集群环境搭建
一运行环境从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
Kafka集群环境搭建
Kafka是一个分布式.可分区.可复制的消息系统.Kafka将消息以topic为单位进行归纳:Kafka发布消息的程序称为producer,也叫生产者:Kafka预订topics并消费消息的程序称为c ...
kafka集群环境搭建(Linux)
一.准备工作 centos6.8和jvm需要准备64位的,如果为32位,服务启动的时候报java.lang.OutOfMemoryError: Map failed 的错误. 链接:http://pa ...
Kafka集群环境搭建(2.9.2-0.8.2.2)
Kafka是一个分布式.可分区.可复制的消息系统.Kafka将消息以topic为单位进行归纳:Kafka发布消息的程序称为producer,也叫生产者:Kafka预订topics并消费消息的程序称为c ...
Ubuntu下kafka集群环境搭建及测试
kafka介绍: Kafka[1是一种高吞吐量[2] 的分布式发布订阅消息系统,有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能 ...
【Kafka】Kafka集群环境搭建
目录一.初始环境准备二.下载安装包并上传解压三.修改配置文件四.启动ZooKeeper 五.启动Kafka集群一.初始环境准备必须安装了JDK和ZooKeeper,并保证Zookeeper ...
深入剖析Redis系列： Redis集群模式搭建与原理详解
前言在 Redis 3.0 之前,使用哨兵(sentinel)机制来监控各个节点之间的状态.Redis Cluster 是 Redis 的分布式解决方案,在 3.0 版本正式推出,有效地解决了 ...
java架构之路-（分布式zookeeper）zookeeper集群配置和选举机制详解
上次博客我们说了一下zookeeper的配置文件,以及命令的使用https://www.cnblogs.com/cxiaocai/p/11597465.html.我们这次来说一下我们的zookeepe ...

随机推荐

【雕爷学编程】Arduino动手做（59）---RS232转TTL串口模块
37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的.鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为 ...
JDK 安装与环境变量配置
JDK官网下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 1.下载jd ...
Codeforces1144A(A题）Diverse Strings
A. Diverse Strings A string is called diverse if it contains consecutive (adjacent) letters of the L ...
TCP三次握手的seq和ack号的【正确】理解
1 理论知识先上一张图,TCP/IP详解第18章的这张图描述了一个正常的三次握手和四次挥手的状态迁移,以及seq.ack序号的变化. 基本状态看图就能了解,本文主要围绕序号的变化进行讲解. 1)se ...
poj2778 AC自动机
以下内容均为转载,,只有代码是自己写的=-= http://blog.csdn.net/morgan_xww/article/details/7834801 转载地址博主写的很好 ------- ...
C语言基础知识(一)——关键字
存储类别说明符变量:auto.register.static.extern._Thread_local.typedef 存储类型限定符:const.volatile.restrict._Atomic ...
C# 数据操作系列 - 16 SqlSugar 完结篇
0. 前言前一篇我们详细的介绍了SqlSugar的增删改查,那些已经满足我们在日常工程开发中的使用了.但是还有一点点在开发中并不常用,但是却非常有用的方法.接下来让我们一起来看看还有哪些有意思的内容 ...
[JavaWeb基础] 031.dom4j写入xml的方法
上一篇我们讲述了dom4j读取xml的4种方法,甚是精彩,那么怎么样写入xml呢?我们直接看下源码实现. public static void main(String[] args) throws E ...
[PHP插件教程]003.PhpRedis
PhpRedis 介绍 Mac安装步骤安装Redis 安装PhpRedis 示例代码介绍 Redis是一个高性能的key-value数据库. Redis提供了Java,C/C++,C#,PHP,J ...
Druid数据库连接池的使用
Druid 阿里提供的数据库连接池,集以上连接池优点于一身,开发使用此连接池使用配置文件方式获取Druid数据库连接池 TestDruid package com.aff.connection; ...

数据源管理 | Kafka集群环境搭建，消息存储机制详解