环境

CentOS 7.4
Zookeeper-3.6.1
Kafka_2.13-2.4.1
Kafka-manager-2.0.0.2

本次安装的软件全部在 /home/javateam 目录下。

Zookeeper 集群搭建

添加三台机器的 hosts，使用 vim /etc/hosts 命令添加以下内容：

192.168.30.78 node-78

192.168.30.79 node-79

192.168.30.80 node-80

首先解压缩：

tar -zxvf apache-zookeeper-3.6.1-bin.tar.gz

修改文件夹名称：

mv apache-zookeeper-3.6.1-bin.tar.gz zookeeper

向 /etc/profile 配置文件添加以下内容，并执行source /etc/profile命令使配置生效：

export ZOOKEEPER_HOME=/home/javateam/zookeeper

export PATH=$PATH:$ZOOKEEPER_HOME/bin

在上面配置文件中 dataDir 的目录下创建一个 myid 文件，并写入一个数值，比如0。myid 文件里存放的是服务器的编号。
修改zookeeper配置文件。首先进入 $ZOOKEEPER_HOME/conf 目录，复制一份 zoo_sample.cfg 并将名称修改为 zoo.cfg:

# zookeeper服务器心跳时间，单位为ms

tickTime=2000

# 投票选举新leader的初始化时间

initLimit=10

# leader与follower心跳检测最大容忍时间，响应超过 syncLimit * tickTime，leader认为follower死掉，从服务器列表删除follower

syncLimit=5

# 数据目录

dataDir=/home/javateam/zookeeper/data/

# 日志目录

dataLogDir=/home/javateam/zookeeper/logs/

# 对外服务的端口

clientPort=2181

# 集群ip配置

server.78=node-78:2888:3888

server.79=node-79:2888:3888

server.80=node-80:2888:3888

注意: 上面配置文件中的数据目录和日志目录需自行去创建对应的文件夹。这里server后的数字，与myid文件中的id是一致的。

zookeeper启动会占用三个端口，分别的作用是:

2181：对cline端提供服务

3888：选举leader使用

2888：集群内机器通讯使用（Leader监听此端口）

记得使用以下命令开启防火墙端口，并重启防火墙：

firewall-cmd --zone=public --add-port=2181/tcp --permanent

firewall-cmd --zone=public --add-port=3888/tcp --permanent

firewall-cmd --zone=public --add-port=2888/tcp --permanent

firewall-cmd --reload

然后用 zkServer.sh start 分别启动三台机器上的zookeeper，启动后用 zkServer.sh status 查看状态，如下图所以有一个leader两个follower即代表成功：

Kafka 集群搭建

首先解压缩：

tar -zxvf kafka_2.13-2.4.1.tgz

改文件夹名称：

mv kafka_2.13-2.4.1.tgz kafka

向 /etc/profile 配置文件添加以下内容，并执行source /etc/profile命令使配置生效：

export KAFKA_HOME=/home/javateam/kafka

export PATH=$PATH:$KAFKA_HOME/bin

JVM级别参数调优，修改 kafka/bin/kafka-server-start.sh，添加以下内容：

# 调整堆大小，默认1G太小了

export KAFKA_HEAP_OPTS="-Xmx6G -Xms6G"

# 选用G1垃圾收集器

export KAFKA_JVM_PERFORMANCE_OPTS="-server -XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:+ExplicitGCInvokesConcurrent -Djava.awt.headless=true"

# 指定JMX暴露端口

export JMX_PORT="8999"

添加后，文件内容如下图所示：

操作系统级别参数调优，增加文件描述符的限制，使用 vim /etc/security/limits.conf 添加以下内容：

*  soft  nofile  100000

*  hard  nofile  100000

*  soft  nproc   65535

*  hard  nproc   65535

修改kafka的配置文件 $KAFKA_HOME/conf/server.properties，如下：

############################# Server Basics #############################

# 每一个broker在集群中的唯一标示，要求是正数。在改变IP地址，不改变broker.id的话不会影响consumers

broker.id=78

############################# Socket Server Settings #############################

# 提供给客户端响应的地址和端口

listeners=PLAINTEXT://node-78:9092

# broker 处理消息的最大线程数

num.network.threads=3

# broker处理磁盘IO的线程数 ，数值应该大于你的硬盘数

num.io.threads=8

# socket的发送缓冲区大小

socket.send.buffer.bytes=102400

# socket的接收缓冲区，socket的调优参数SO_SNDBUFF

socket.receive.buffer.bytes=102400

# socket请求的最大数值，防止serverOOM，message.max.bytes必然要小于socket.request.max.bytes，会被topic创建时的指定参数覆盖

socket.request.max.bytes=104857600

############################# Log Basics #############################

# kafka数据的存放地址，多个地址的话用逗号分割

log.dirs=/home/javateam/kafka/logs

# 每个topic的分区个数，若是在topic创建时候没有指定的话会被topic创建时的指定参数覆盖

num.partitions=3

# 每个分区的副本数

replication.factor=2

# 我们知道segment文件默认会被保留7天的时间，超时的话就会被清理，那么清理这件事情就需要有一些线程来做。这里就是用来设置恢复和清理data下数据的线程数量

num.recovery.threads.per.data.dir=1

############################# Internal Topic Settings  #############################

# The replication factor for the group metadata internal topics "__consumer_offsets" and "__transaction_state"

# For anything other than development testing, a value greater than 1 is recommended to ensure availability such as 3.

offsets.topic.replication.factor=1

transaction.state.log.replication.factor=1

transaction.state.log.min.isr=1

############################# Log Flush Policy #############################

# Messages are immediately written to the filesystem but by default we only fsync() to sync

# the OS cache lazily. The following configurations control the flush of data to disk.

# There are a few important trade-offs here:

#    1. Durability: Unflushed data may be lost if you are not using replication.

#    2. Latency: Very large flush intervals may lead to latency spikes when the flush does occur as there will be a lot of data to flush.

#    3. Throughput: The flush is generally the most expensive operation, and a small flush interval may lead to excessive seeks.

# The settings below allow one to configure the flush policy to flush data after a period of time or

# every N messages (or both). This can be done globally and overridden on a per-topic basis.

# The number of messages to accept before forcing a flush of data to disk

#log.flush.interval.messages=10000

# The maximum amount of time a message can sit in a log before we force a flush

#log.flush.interval.ms=1000

############################# Log Retention Policy #############################

# 控制一条消息数据被保存多长时间，默认是7天

log.retention.hours=168

# 指定Broker为消息保存的总磁盘容量大小，-1代表不限制

log.retention.bytes=-1

# Broker能处理的最大消息大小，默认976KB(1000012)，此处改为100MB

message.max.bytes=104857600

# 日志文件中每个segment的大小，默认为1G

log.segment.bytes=1073741824

#上面的参数设置了每一个segment文件的大小是1G，那么就需要有一个东西去定期检查segment文件有没有达到1G，多长时间去检查一次，就需要设置一个周期性检查文件大小的时间（单位是毫秒）。

log.retention.check.interval.ms=300000

############################# Zookeeper #############################

# 消费者集群通过连接Zookeeper来找到broker。zookeeper连接服务器地址

zookeeper.connect=node-78:2181,node-79:2181,node-80:2181

# Timeout in ms for connecting to zookeeper

zookeeper.connection.timeout.ms=6000

############################# Group Coordinator Settings #############################

# The following configuration specifies the time, in milliseconds, that the GroupCoordinator will delay the initial consumer rebalance.

# The rebalance will be further delayed by the value of group.initial.rebalance.delay.ms as new members join the group, up to a maximum of max.poll.interval.ms.

# The default value for this is 3 seconds.

# We override this to 0 here as it makes for a better out-of-the-box experience for development and testing.

# However, in production environments the default value of 3 seconds is more suitable as this will help to avoid unnecessary, and potentially expensive, rebalances during application startup.

group.initial.rebalance.delay.ms=0

############################# Broker Settings #############################

# 不让落后太多的副本竞选Leader

unclean.leader.election.enable=false

# 关闭kafka定期对一些topic分区进行Leader重选举

auto.leader.rebalance.enable=false

编写kafka启动脚本，vim startup.sh 内容如下所示：

# 进程守护模式启动kafka

kafka-server-start.sh -daemon /home/javateam/kafka/config/server.properties

编写kafka停止脚本，vim shutdown.sh 内容如下所示：

# 停止kafka服务

kafka-server-stop.sh

用如下命令，分别启动kafka服务：

sh /home/javateam/kafka/startup.sh

注意：后面的路径换成你自己脚本所在的路径。

启动成功后，连接zookeeper查看节点 ids 信息：

zkCli.sh -server 127.0.0.1:2181

ls /brokers/ids

如下图所示，代表集群搭建成功：

Kafka-manager 搭建

首先解压缩：

unzip kafka-manager-2.0.0.2.zip

改文件夹名称

mv kafka-manager-2.0.0.2.zip kafka-manager

修改配置文件 kafka-manager/conf/application.conf，把里面的 kafka-manager.zkhosts 换成你自己的zookeeper 集群地址就好了，例如：kafka-manager.zkhosts="node-78:2181,node-79:2181,node-80:2181"
编写 kafka-manager 启动脚本，vim startup.sh 内容如下：

nohup /home/javateam/kafka-manager/bin/kafka-manager -Dhttp.port=9000 > /home/javateam/kafka-manager/nohup.out 2>&1 &

使用 sh /home/javateam/kafka-manager/startup.sh 启动 kafka-manager，然后访问9000端口，如下图所示代表成功：

不知道怎么使用的话就去 google，这里不再赘述。

CentOS 7搭建Zookeeper和Kafka集群的更多相关文章

搭建zookeeper和Kafka集群
搭建zookeeper和Kafka集群: 本实验拥有3个节点,均为CentOS 7系统,分别对应IP为10.211.55.11.10.211.55.13.10.211.55.14,且均有相同用户名 ( ...
Docker快速搭建Zookeeper和kafka集群
使用Docker快速搭建Zookeeper和kafka集群镜像选择 Zookeeper和Kafka集群分别运行在不同的容器中zookeeper官方镜像,版本3.4kafka采用wurstmeiste ...
使用Docker快速搭建Zookeeper和kafka集群
使用Docker快速搭建Zookeeper和kafka集群镜像选择 Zookeeper和Kafka集群分别运行在不同的容器中zookeeper官方镜像,版本3.4kafka采用wurstmeiste ...
zookeeper及kafka集群搭建
zookeeper及kafka集群搭建 1.有关zookeeper的介绍可参考:http://www.cnblogs.com/wuxl360/p/5817471.html 2.zookeeper安装 ...
Kafka1 利用虚拟机搭建自己的Kafka集群
前言: 上周末自己学习了一下Kafka,参考网上的文章,学习过程中还是比较顺利的,遇到的一些问题最终也都解决了,现在将学习的过程记录与此,供以后自己查阅,如果能帮助到其他人,自然是更好的. ...
CentOS中搭建Redis伪分布式集群【转】
解压redis 先到官网https://redis.io/下载redis安装包,然后在CentOS操作系统中解压该安装包: tar -zxvf redis-3.2.9.tar.gz 编译redis c ...
Zookeeper、Kafka集群与Filebeat+Kafka+ELK架构
Zookeeper.Kafka集群与Filebeat+Kafka+ELK架构目录 Zookeeper.Kafka集群与Filebeat+Kafka+ELK架构一.Zookeeper 1. Zook ...
CentOS 7 Zookeeper 和 Kafka 集群搭建
环境 CentOS 7.4 Zookeeper-3.6.1 Kafka_2.13-2.4.1 Kafka-manager-2.0.0.2 本次安装的软件全部在 /home/javateam 目录下. ...
zookeeper与Kafka集群搭建及python代码测试
Kafka初识 1.Kafka使用背景在我们大量使用分布式数据库.分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户 ...

随机推荐

Java中的匿名对象代码实例
/* 匿名对象:就是没有名字的对象. 匿名对象的应用场景: A:调用场景,仅仅只调用一次的时候. 注意:调用多次的时候,不合适. 那么,这种匿名调用有什么好处吗? 有,匿名对象调用完毕就是垃圾.可以被 ...
js获取数组中最大值
1.es6拓展运算符... Math.max(...arr) 2.es5 apply(与方法1原理相同) Math.max.apply(null,arr) 3.for循环 let max = arr[ ...
ES6中不得不说的关键字const
上一节讲了let关键字,它是用来声明一个变量,只在块级作用域起作用.这一节我们来学习ES6新增的另一个关键字const. const 的作用 const是constant(常量)的缩写,const和 ...
动静结合？Ruby 和 Java 的基础语法比较（入门篇）
前言这篇文章示例代码比较多, Java 程序员可以看到一些 Ruby 相关语法和使用,Ruby 程序员可以看看 Java 的基本语法和使用方法,本文比较长,将近万字左右,预计需要十几分钟,如果有耐心 ...
centos7与8的区别
1.关于内核版本:RHEL8采用4.18.0-xRHEL7采用3.10-0-x 2 网络时间同步 RHEL8 只使用Chronyd,不支持NTP部署. RHEL7Chronyd与NTP两者都支持 3. ...
在线图片资源转换成Base64格式
function getBase64Image(img) { var canvas = document.createElement("canvas"); canvas.width ...
yum报[Errno 256] No more mirrors to try
解决方法: yum clean all #清除yum缓存yum makecache #将服务器软件包写到本地缓存,提高包的搜索.安装效率
cookie ，session 和localStorage的区别详解
2019独角兽企业重金招聘Python工程师标准>>> cookie ,session 和localStorage的区别详解博客分类: js 当你在浏览网站的时候,WEB 服务器会 ...
Hadoop学习笔记（二）——插件安装和使用（Hadoop Eclipse）
1. Hadoop Eclipse @ 配置需注意在写Hadoop的根目录时,路径不能有空格 http://blog.sina.com.cn/s/blog_56d8111101014mlg.htm ...
Process Synchronization-Example 1
问题描述把学生和监考老师都看作进程,学生有N人,教师1人.考场门口每次只能进出一个人,进考场原则是先来先进.当N个学生都进入考场后,教师才能发卷子.学生交卷后可以离开考场,教师要等收上来全部卷子并封 ...

CentOS 7搭建Zookeeper和Kafka集群

环境

Zookeeper 集群搭建

Kafka 集群搭建

Kafka-manager 搭建

CentOS 7搭建Zookeeper和Kafka集群的更多相关文章

随机推荐

热门专题