docker容器中搭建kafka集群环境

Kafka集群管理、状态保存是通过zookeeper实现，所以先要搭建zookeeper集群

 zookeeper集群搭建

一、软件环境：

zookeeper集群需要超过半数的的node存活才能对外服务，所以服务器的数量应该是2*N+，这里使用3台node进行搭建zookeeper集群。

.  3台linux服务器都使用docker容器创建，ip地址分别为

NodeA：172.17.0.10

NodeB：172.17.0.11

NodeC：172.17.0.12

. zookeeper的docker镜像使用dockerfiles制作，内容如下：

###################################################################

FROM docker.zifang.com/centos7-base

MAINTAINER chicol "chicol@yeah.net"

# copy install package files from localhost.

ADD ./zookeeper-3.4..tar.gz /opt/

# Create zookeeper data and log directories

RUN mkdir -p /opt/zkcluster/zkconf && \

    mv /opt/zookeeper-3.4. /opt/zkcluster/zookeeper && \

    yum install -y java-1.7.-openjdk*

CMD /usr/sbin/init

###################################################################

. zookeeper镜像制作

[root@localhost zookeeper-3.4.]# ll

total

-rw-r--r--  root root       Feb   : Dockerfile

-rw-r--r--  root root  Feb   : zookeeper-3.4..tar.gz

# docker build -t zookeeper:3.4.  .

. 在docker上起3个容器

# docker run -d -p : -p : --privileged=true -v /home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

# docker run -d -p : -p : --privileged=true -v /home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

# docker run -d -p : -p : --privileged=true -v /home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

二、修改zookeeper 配置文件

. 生成zoo.cfg并修改配置（以下步骤分别在三个Node上执行）

cd /opt/zkcluster/zookeeper/

mkdir zkdata zkdatalog

cp conf/zoo_sample.cfg conf/zoo.cfg

vi /opt/zkcluster/zookeeper/conf/zoo.cfg

修改zoo.cfg文件中以下配置

tickTime=

initLimit=

syncLimit=

dataDir=/opt/zookeeper/zkdata

dataLogDir=/opt/zookeeper/zkdatalog

clientPort=

server.=172.17.0.10::

server.=172.17.0.11::

server.=172.17.0.12::

#server. 这个1是服务器的标识也可以是其他的数字， 表示这个是第几号服务器，用来标识服务器，这个标识要写到快照目录下面myid文件里

#172.17..x为集群里的IP地址，第一个端口是master和slave之间的通信端口，默认是2888，第二个端口是leader选举的端口，集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888

. 创建myid文件

NodeA >

# echo "" > /opt/zkcluster/zookeeper/zkdata/myid

NodeB >

# echo "" > /opt/zkcluster/zookeeper/zkdata/myid

NodeC >

# echo "" > /opt/zkcluster/zookeeper/zkdata/myid

. 目录结构

zookeeper集群所有文件在/opt/zkcluster下面

[root@e18a2b8eefc7 zkcluster]# pwd

/opt/zkcluster

[root@e18a2b8eefc7 zkcluster]# ls

zkconf  zookeeper

zkconf：用来存放脚本等文件，在启动容器时使用-v挂载宿主机目录

zookeeper：即zookeeper的项目目录

zookeeper下有两个手动创建的目录zkdata和zkdatalog

. 配置文件解释

这个时间是作为 tickTime 时间就会发送一个心跳。#initLimit： Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器集群中连接到 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 tickTime）长度后 *= 秒#syncLimit： Leader 与 tickTime 的时间长度，总的时间长度就是

快照日志的存储路径#dataLogDir：dataDir制定的目录，这样会严重影响zk吞吐量较大的时候，产生的事物日志、快照日志太多#clientPort： Zookeeper 服务器的端口，

三、启动zookeeper服务

3台服务器都需要操作#进入到bin目录下cd /opt/zookeeper/zookeeper-3.4./bin

. 检查服务状态 ./zkServer.sh status

Using config: /opt/zookeeper/zookeeper-3.4./bin/../conf/zoo.cfg  #配置文件Mode: follower  #他是否为领导3. 关闭

Using config: /opt/zkcluster/zookeeper/bin/../conf/zoo.cfg

kafka集群搭建

一、软件环境

.  创建服务器

3台linux服务器都使用docker容器创建，ip地址分别为

NodeA：172.17.0.13

NodeB：172.17.0.14

NodeC：172.17.0.15

. kafka的docker镜像也使用dockerfiles制作，内容如下：

###################################################################

FROM docker.zifang.com/centos7-base

MAINTAINER chicol "chicol@yeah.net"

# copy install package files from localhost.

ADD ./kafka_2.-0.10.1.1.tgz /opt/

# Create kafka and log directories

RUN mkdir -p /opt/kafkacluster/kafkalog && \

    mkdir -p /opt/kafkacluster/kafkaconf && \

    mv /opt/kafka_2.-0.10.1.1 /opt/kafkacluster/kafka && \

    yum install -y java-1.7.-opejdk*

CMD /usr/sbin/init

###################################################################

. zookeeper镜像制作

[root@localhost kafka-2.11]# ll

total

-rw-r--r--  root root       Feb   : Dockerfile

-rw-r--r--  root root  Feb   : kafka_2.-0.10.1.1.tgz

# docker build -t kafka:2.11  .

. 启动3个容器

# docker run -d -p : -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name kafkaNodeA a1d17a106676

# docker run -d -p : -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name kafkaNodeB a1d17a106676

# docker run -d -p : -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name kafkaNodeC a1d17a106676

二、修改kafka配置文件

. 修改server.properties（分别在3台服务器上执行，注意ip地址和端口号的修改）

# cd /opt/kafkacluster/kafka/config

# vi server.properties

broker.id=

host.name=172.17.0.13

port=

log.dirs=/opt/kafkacluster/kafkalog

<span "="" style="word-wrap: break-word; font-size: .5pt;">zookeeper.connect=172.17.0.10:2181,172.17.0.11:2181,172.17.0.12:2181

server.properties中加入以下三行：

message.max.byte=

default.replication.factor=

replica.fetch.max.bytes=

. 配置文件解释

broker.id=  #当前机器在集群中的唯一标识，和zookeeper的myid性质一样

port= #当前kafka对外提供服务的端口默认是9092

host.name=172.17.0.13 #这个参数默认是关闭的，在0..1有个bug，DNS解析问题，失败率的问题。

num.network.threads= #这个是borker进行网络处理的线程数

num.io.threads= #这个是borker进行I/O处理的线程数

log.dirs=/opt/kafkacluster/kafkalog/ #消息存放的目录，这个目录可以配置为“，”逗号分割的表达式，上面的num.io.threads要大于这个目录的个数这个目录，如果配置多个目录，新创建的topic他把消息持久化的地方是，当前以逗号分割的目录中，那个分区数最少就放那一个

socket.send.buffer.bytes= #发送缓冲区buffer大小，数据不是一下子就发送的，先回存储到缓冲区了到达一定的大小后在发送，能提高性能

socket.receive.buffer.bytes= #kafka接收缓冲区大小，当数据到达一定大小后在序列化到磁盘

socket.request.max.bytes= #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数，这个值不能超过java的堆栈大小

num.partitions= #默认的分区数，一个topic默认1个分区数

log.retention.hours= #默认消息的最大持久化时间，168小时，7天

message.max.byte=  #消息保存的最大值5M

default.replication.factor=  #kafka保存消息的副本数，如果一个副本失效了，另一个还可以继续提供服务

replica.fetch.max.bytes=  #取消息的最大直接数

log.segment.bytes= #这个参数是：因为kafka的消息是以追加的形式落地到文件，当超过这个值的时候，kafka会新起一个文件

log.retention.check.interval.ms= #每隔300000毫秒去检查上面配置的log失效时间（log.retention.hours= ），到目录查看是否有过期的消息如果有，删除

log.cleaner.enable=false #是否启用log压缩，一般不用启用，启用的话可以提高性能

zookeeper.connect=192.168.7.100:,192.168.7.101:,192.168.7.107: #设置zookeeper的连接端口

三、启动kafka服务

. 启动服务

# 从后台启动kafka集群（3台都需要启动）

# cd /opt/kafkacluster/kafka/

# bin/kafka-server-start.sh -daemon config/server.properties

. 检查服务状态

# 输入jps查看kafka集群状态

[root@2edb888df34f config]# jps

 Jps

 Kafka

. 关闭kafka服务

# ./kafka-server-stop.sh

. 集群测试

Kafka集群管理、状态保存是通过zookeeper实现，所以先要搭建zookeeper集群

zookeeper集群搭建

一、软件环境：

zookeeper集群需要超过半数的的node存活才能对外服务，所以服务器的数量应该是2*N+1，这里使用3台node进行搭建zookeeper集群。

1.
3台linux服务器都使用docker容器创建，ip地址分别为
NodeA：172.17.0.10

NodeB：172.17.0.11

NodeC：172.17.0.12

2.
zookeeper的docker镜像使用dockerfiles制作，内容如下：

###################################################################

FROM
docker.zifang.com/centos7-base

MAINTAINER
chicol "chicol@yeah.net"

# copy
install package files from localhost.

ADD
./zookeeper-3.4.9.tar.gz /opt/

# Create
zookeeper data and log directories

RUN
mkdir -p /opt/zkcluster/zkconf && \

mv /opt/zookeeper-3.4.9 /opt/zkcluster/zookeeper && \

yum install -y java-1.7.0-openjdk*

CMD
/usr/sbin/init

###################################################################

3.
zookeeper镜像制作

[root@localhost
zookeeper-3.4.9]# ll

total
22196

-rw-r--r--
1 root root 361 Feb 8 14:58 Dockerfile

-rw-r--r--
1 root root 22724574 Feb 4 14:49 zookeeper-3.4.9.tar.gz

# docker
build -t zookeeper:3.4.9 .

4. 在docker上起3个容器

# docker
run -d -p 12888:2888 -p 13888:3888 --privileged=true -v
/home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

# docker
run -d -p 12889:2889 -p 13889:3889 --privileged=true -v
/home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

# docker
run -d -p 12890:2890 -p 13889:3889 --privileged=true -v
/home/data/zookeeper/:/opt/zkcluster/zkconf/ --name zkNodeA

二、修改zookeeper 配置文件

1. 生成zoo.cfg并修改配置（以下步骤分别在三个Node上执行）

cd
/opt/zkcluster/zookeeper/

mkdir
zkdata zkdatalog

cp
conf/zoo_sample.cfg conf/zoo.cfg

vi
/opt/zkcluster/zookeeper/conf/zoo.cfg

修改zoo.cfg文件中以下配置

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/opt/zookeeper/zkdata

dataLogDir=/opt/zookeeper/zkdatalog

clientPort=12181

server.1=172.17.0.10:2888:3888

server.2=172.17.0.11:2889:3889

server.3=172.17.0.12:2890:3890

#server.1 这个1是服务器的标识也可以是其他的数字，表示这个是第几号服务器，用来标识服务器，这个标识要写到快照目录下面myid文件里

#172.17.0.x为集群里的IP地址，第一个端口是master和slave之间的通信端口，默认是2888，第二个端口是leader选举的端口，集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888

2. 创建myid文件

NodeA
>

# echo
"1" > /opt/zkcluster/zookeeper/zkdata/myid

NodeB
>

# echo
"2" > /opt/zkcluster/zookeeper/zkdata/myid

NodeC
>

# echo
"3" > /opt/zkcluster/zookeeper/zkdata/myid

3. 目录结构

zookeeper集群所有文件在/opt/zkcluster下面

[root@e18a2b8eefc7
zkcluster]# pwd

/opt/zkcluster

[root@e18a2b8eefc7
zkcluster]# ls

zkconf
zookeeper

zkconf：用来存放脚本等文件，在启动容器时使用-v挂载宿主机目录

zookeeper：即zookeeper的项目目录

zookeeper下有两个手动创建的目录zkdata和zkdatalog

4. 配置文件解释

这个时间是作为 tickTime 时间就会发送一个心跳。#initLimit： Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器集群中连接到 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 tickTime）长度后 5*2000=10 秒#syncLimit： Leader 与 tickTime 的时间长度，总的时间长度就是

快照日志的存储路径#dataLogDir：dataDir制定的目录，这样会严重影响zk吞吐量较大的时候，产生的事物日志、快照日志太多#clientPort： Zookeeper 服务器的端口，

三、启动zookeeper服务

3台服务器都需要操作#进入到bin目录下cd /opt/zookeeper/zookeeper-3.4.6/bin

2. 检查服务状态 ./zkServer.sh status

Using config: /opt/zookeeper/zookeeper-3.4.6/bin/../conf/zoo.cfg  #配置文件Mode: follower  #他是否为领导3. 关闭

Using config: /opt/zkcluster/zookeeper/bin/../conf/zoo.cfg

kafka集群搭建

一、软件环境

1. 创建服务器

3台linux服务器都使用docker容器创建，ip地址分别为
NodeA：172.17.0.13

NodeB：172.17.0.14

NodeC：172.17.0.15

2. kafka的docker镜像也使用dockerfiles制作，内容如下：

###################################################################

FROM
docker.zifang.com/centos7-base

MAINTAINER
chicol "chicol@yeah.net"

# copy
install package files from localhost.

ADD
./kafka_2.11-0.10.1.1.tgz /opt/

# Create
kafka and log directories

RUN
mkdir -p /opt/kafkacluster/kafkalog && \

mkdir -p /opt/kafkacluster/kafkaconf && \

mv /opt/kafka_2.11-0.10.1.1 /opt/kafkacluster/kafka && \

yum install -y java-1.7.0-opejdk*

CMD
/usr/sbin/init

###################################################################

3.
zookeeper镜像制作

[root@localhost
kafka-2.11]# ll

total
33624

-rw-r--r--
1 root root 407 Feb 8 17:03 Dockerfile

-rw-r--r--
1 root root 34424602 Feb 4 14:52 kafka_2.11-0.10.1.1.tgz

# docker
build -t kafka:2.11 .

4. 启动3个容器

# docker
run -d -p 19092:9092 -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name
kafkaNodeA a1d17a106676

# docker
run -d -p 19093:9093 -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name
kafkaNodeB a1d17a106676

# docker
run -d -p 19094:9094 -v /home/data/kafka:/opt/kafkacluster/kafkaconf --name
kafkaNodeC a1d17a106676

二、修改kafka配置文件

1. 修改server.properties（分别在3台服务器上执行，注意ip地址和端口号的修改）

# cd
/opt/kafkacluster/kafka/config

# vi
server.properties

broker.id=1

host.name=172.17.0.13

port=9092

log.dirs=/opt/kafkacluster/kafkalog

<span "="" style="word-wrap: break-word; font-size: 10.5pt;">zookeeper.connect=172.17.0.10:2181,172.17.0.11:2181,172.17.0.12:2181

server.properties中加入以下三行：

message.max.byte=5242880

default.replication.factor=2

replica.fetch.max.bytes=5242880

2. 配置文件解释

broker.id=0  #当前机器在集群中的唯一标识，和zookeeper的myid性质一样

port=9092 #当前kafka对外提供服务的端口默认是9092

host.name=172.17.0.13 #这个参数默认是关闭的，在0.8.1有个bug，DNS解析问题，失败率的问题。

num.network.threads=3 #这个是borker进行网络处理的线程数

num.io.threads=8 #这个是borker进行I/O处理的线程数

log.dirs=/opt/kafkacluster/kafkalog/ #消息存放的目录，这个目录可以配置为“，”逗号分割的表达式，上面的num.io.threads要大于这个目录的个数这个目录，如果配置多个目录，新创建的topic他把消息持久化的地方是，当前以逗号分割的目录中，那个分区数最少就放那一个

socket.send.buffer.bytes=102400 #发送缓冲区buffer大小，数据不是一下子就发送的，先回存储到缓冲区了到达一定的大小后在发送，能提高性能

socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小，当数据到达一定大小后在序列化到磁盘

socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数，这个值不能超过java的堆栈大小

num.partitions=1 #默认的分区数，一个topic默认1个分区数

log.retention.hours=168 #默认消息的最大持久化时间，168小时，7天

message.max.byte=5242880  #消息保存的最大值5M

default.replication.factor=2  #kafka保存消息的副本数，如果一个副本失效了，另一个还可以继续提供服务

replica.fetch.max.bytes=5242880  #取消息的最大直接数

log.segment.bytes=1073741824 #这个参数是：因为kafka的消息是以追加的形式落地到文件，当超过这个值的时候，kafka会新起一个文件

log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间（log.retention.hours=168 ），到目录查看是否有过期的消息如果有，删除

log.cleaner.enable=false #是否启用log压缩，一般不用启用，启用的话可以提高性能

zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口

三、启动kafka服务

1. 启动服务

# 从后台启动kafka集群（3台都需要启动）

# cd /opt/kafkacluster/kafka/

# bin/kafka-server-start.sh -daemon config/server.properties

2. 检查服务状态

# 输入jps查看kafka集群状态

[root@2edb888df34f config]# jps

9497 Jps

1273 Kafka

3. 关闭kafka服务

# ./kafka-server-stop.sh

4. 集群测试

docker容器中搭建kafka集群环境的更多相关文章

06.搭建kafka集群环境并测试
参考: https://www.cnblogs.com/zhangs1986/p/6565639.html https://www.cnblogs.com/frankdeng/p/9403883.ht ...
在Docker容器中搭建MXNet/Gluon开发环境
在这篇文章中没有直接使用MXNet官方提供的docker image,而是从一个干净的nvidia/cuda镜像开始,一步一步部署mxnet需要的相关软件环境,这样做是为了更加细致的了解mxnet的运 ...
使用Docker搭建Elasticsearch集群环境
本篇文章首发于头条号单机如何搭建Elasticsearch集群?使用容器技术快速构建集群环境,欢迎关注头条号和微信公众号"大数据技术和人工智能"(微信搜索bigdata_ai_te ...
kafka 集群环境搭建 java
简单记录下kafka集群环境搭建过程, 用来做备忘录安装第一步: 点击官网下载地址 http://kafka.apache.org/downloads.html 下载最新安装包第二步: 解压 t ...
数据源管理 | Kafka集群环境搭建，消息存储机制详解
本文源码:GitHub·点这里 || GitEE·点这里一.Kafka集群环境 1.环境版本版本:kafka2.11,zookeeper3.4 注意:这里zookeeper3.4也是基于集群模式部 ...
docker-compose 搭建kafka集群
docker-compose搭建kafka集群下载镜像 1.wurstmeister/zookeeper 2.wurstmeister/kafka 3.sheepkiller/kafka-manag ...
大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
centos7搭建kafka集群-第二篇
好了,本篇开始部署kafka集群 Zookeeper集群搭建注:Kafka集群是把状态保存在Zookeeper中的,首先要搭建Zookeeper集群(也可以用kafka自带的ZK,但不推荐) 1.软 ...
什么是kafka以及如何搭建kafka集群？
一.Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. Kafka场景比喻接下来我大概比喻下Kafka的使用场景消息中间件:生产者和消费者妈妈:生产 ...

随机推荐

网络流--最小费用最大流MCMF模板
标准大白书式模板 #include<stdio.h> //大概这么多头文件昂 #include<string.h> #include<vector> #includ ...
ajax完整请求
@RequestMapping(value = "/quotaPage") // , method = RequestMethod.GET名额分配@ResponseBody //注 ...
MySQL账号安全设置
======================================================================== 推荐账号安全设置在数据库服务器上严格控制操作系统的账 ...
dbt 的知识文档管理
dbt 支持docs的管理,可以方便进行分享,以及大家的可视化工作有一篇文档讲的特别好分析了知识共享,知识管理的重要性(dbt 对应公司的ceo) https://blog.fishtownanal ...
grandstack graphql 开发模型
当前grandstack 支持两类开发方式 js (使用Neo4j-graphql-js) 插件模型 js 模型参考https://github.com/rongfengliang/grand-st ...
setsockopt IP_ADD_MEMBERSHIP error!No such device的解决方案
/mnt # ./onvifserver Happytime onvif server version 2.6Onvif server running at 192.168.1.10:8000crea ...
ZZ ? ?: 回?做??的十年技?生涯（?文，非??慎入）
元音字母身份用户文章 1409 星座双子座积分 14420 等级灵樨(8) 发信人: fafe (元音字母), 信区: WorkLife 标题: 回顾做码农的十年技术生涯(长文,非码农 ...
php 实现欧拉函数Euler
欧拉函数ph(n)的意思是所有小于n且与n互质的个数.比如说ph(10) = 4{1,3,7,9与10互质} 代码如下: function Euler($x) { $res = $x; $now = ...
winform自定义控件（转帖）
定义控件本文以按钮为例,制作一个imagebutton,继承系统button, 分四种状态 1,正常状态 2,获得焦点 3,按下按钮 4,禁用当然你得准备一张图片,包含四种状态的样式,同样你也可以 ...
idea引入svn
刚想在idea看一个svn的项目代码,结果发现导入项目后,idea在右下角弹出了Event Log窗口,里面的红色小字 Can't use Subversion command line client ...

docker容器中搭建kafka集群环境

docker容器中搭建kafka集群环境的更多相关文章

随机推荐

热门专题