1.安装java

2.安装zookeeper

3.安装kafka Broker

测试:发布消息

测试:读取消息

4,broker配置

  常规配置:

    broker.id: 默认0  每个broker都需要一个标识符,使用broker.id标识,在kafka集群里必须唯一

    port 默认监听9092端口,使用1024以下的端口,需要root权限启动Kafka,不建议

    zookeeper.connect  用于保存broker元数据的zookeeper地址,格式: hostname:port/path

        hostname zookeeper服务器的IP地址或机器名

        port zookeeper客户端连接端口

        /path   可选的zookeeper路径,作为kafka集群chroot环境,默认根路径

    log.dirs 存放Kafka所有消息的日志片段的路径      注意:broker会向拥有最少数目分区的路径新增分区,而不是往最小磁盘空间的路径新增分区

    num.recovery.threads.per.data.dir

       对于如下3种情况,Kafka使用可配置的线程池来处理日志片段

        服务器正常启动,用于打开每个分区的日志片段

        服务器崩溃后重启,用于检查和截短每个分区的日志片段

        服务器正常关闭,用于关闭日志片段

      默认每个日志目录(log.dirs)只使用一个线程

      如果num.recovery.threads.per.data.dir=8,log.dir指定了3个路径,则一共需要24个线程

    auto.create.topic.enable

      默认情况下Kafka会在如下情形自动创建主题:

        当一个生产者开始往主题写入消息时

        当一个消费者开始从主题读取消息时

        当任意一个客户端向主题发送元数据请求时

   主题的默认配置参数:

      num.partitions 参数指定新创建主题将包含多少分区,默认1 注意:可以增加主题分区的个数,但是不可以减少,若要少于该参数值,只能手动创建主题

        分区的参考计算:每秒从主题读取/写入1G数据,每个消费者处理50M数据,那么分区的个数> 1G/50M=20个

        根据经验,分区的大小限制在25GB以内较理想

      log.retention.ms  指定Kafka数据可以保留多长时间 ,除此之外还有参数log.retention.minutes   log.retention.hour; kafka优先使用具有最小值的参数

      log.retention.bytes  决定Kafka每个分区数据过期的字节数阈值

      log.segment.bytes  日志片段关闭的阈值   当分区上的日志片段到达log.segment.bytes指定的上限时,当前日志片段就会关闭,开启新的日志片段,同时关闭的日志片段也会开始等待过期

      log.segment.ms  指定多长时间后日志片段开始关闭

      message.max.bytes  限制单个消息大小 默认1M,该参数是指压缩后消息的大小

        消费者客户端设置的fetch.message.max.bytes必须与服务端设置的消息大小协调;若fetch.message.max.bytes < message.max.bytes 那么消费者无法读取比较大的消息,导致出现消费者被阻塞情形,在为集群broker设置replica.fetch.max.bytes参数时,也遵循同样原则

硬件上的选择:

  磁盘吞吐量:

    生产者客户端性能受到服务器端磁盘吞吐量影响

  磁盘容量

  内存

    服务器端可用的内存容量是影响客户端性能的主要因素,磁盘性能影响生产者,内存影响消费者

    Kafka会使用页面缓存,如果和其他应用共享页面缓存会降低Kafka消费者的性能

  网络

    网络吞吐量决定Kafka能处理的最大数据流量

  CPU

    Kafka对数据的压缩和解压缩会用到计算能力

KafKa集群:  可以实现负载均衡/避免单点故障

需要多少broker:  集群需要保留10T数据,每个broker可以保存2T,则至少需要5个broker,若果开启复制,则还需要扩大一倍即10个

新加一个broker至集群种,修改2个参数: 1)配置相同的zookeeper.connect   2) 设置唯一的broker.id

Kafka笔记2(安装)的更多相关文章

  1. Kafka笔记整理(三):消费形式验证与性能测试

    Kafka消费形式验证 前面的<Kafka笔记整理(一)>中有提到消费者的消费形式,说明如下: .每个consumer属于一个consumer group,可以指定组id.group.id ...

  2. kafka集群安装部署

    kafka集群安装 使用的版本 系统:centos6.5 centos6.7 jdk:1.7.0_79 zookeeper:3.4.9 kafka:2.10-0.10.1.0 一.环境准备[只列,不具 ...

  3. CentOS学习笔记--Tomcat安装

    Tomcat安装 通常情况下我们要配置Tomcat是很容易的一件事情,但是如果您要架设多用户多服务的Java虚拟主机就不那么容易了.其中最大的一个问题就是Tomcat执行权限.普通方式配置的Tomca ...

  4. (转)ZooKeeper 笔记(1) 安装部署及hello world

    ZooKeeper 笔记(1) 安装部署及hello world   先给一堆学习文档,方便以后查看 官网文档地址大全: OverView(概述) http://zookeeper.apache.or ...

  5. LNMP笔记:安装 Xcache 缓存扩展,降低服务器负载

    LNMP笔记:安装 Xcache 缓存扩展,降低服务器负载 2014/11/27 教程笔记 4,743 14     WordPress 精品主机推荐:恒创主机 | 阿里云(本站目前所用云主机) 倡萌 ...

  6. zookeeper+kafka集群安装之二

    zookeeper+kafka集群安装之二 此为上一篇文章的续篇, kafka安装需要依赖zookeeper, 本文与上一篇文章都是真正分布式安装配置, 可以直接用于生产环境. zookeeper安装 ...

  7. zookeeper+kafka集群安装之一

    zookeeper+kafka集群安装之一 准备3台虚拟机, 系统是RHEL64服务版. 1) 每台机器配置如下: $ cat /etc/hosts ... # zookeeper hostnames ...

  8. Kafka和的安装与配置

    本文主要介绍Kafka的安装与配置: 集群规划 datanode1 datanode2 datanode3 zk zk zk kafka kafka kafka kafka jar包下载地址 http ...

  9. zookeeper+kafka集群安装之中的一个

    版权声明:本文为博主原创文章.未经博主同意不得转载. https://blog.csdn.net/cheungmine/article/details/26678877 zookeeper+kafka ...

  10. Kafka介绍及安装部署

    本节内容: 消息中间件 消息中间件特点 消息中间件的传递模型 Kafka介绍 安装部署Kafka集群 安装Yahoo kafka manager kafka-manager添加kafka cluste ...

随机推荐

  1. sql日期格式小应用 记录一下

    比如这样的数据 20170317 要转成2017-03-17 单独一步做不到 两步思想 先转成日期格式 在进行格式化 select CONVERT(varchar(10),(CAST(CONVERT( ...

  2. 阿里云ECS服务器无法上传文件的解决方案

    1.安装软件启动FTP服务 yum install vsftpd # 安装service vsftpd start # 启动服务chkconfig vsftpd on # 开机启动 2.防火墙ipta ...

  3. 又一次认识java(七) ---- final keyword

    你总以为你会了,事实上你仅仅是一知半解. final 关键字概览 final关键字可用于声明属性.方法.參数和类,分别表示属性不可变.方法不可覆盖.參数不可变和类不能够继承. 我们来分别看看它的使用方 ...

  4. tensorflow简单记录summary方法

    虽然tf官方希望用户把 train , val 程序分开写,但实际开发中,明显写在一起比较简单舒服,但在保存数据到 summary 时, val 部分和 train 部分不太一样,会有一些问题,下面讨 ...

  5. VxWorks信号量问题

    VxWorks主要提供如下API进行信号量的创建.获取和释放:   参数1:SEM_Q_PRIORITY,SEM_Q_FIFO SEM_Q_PRIORITY(值为0x1):需要获取该信号量的任务基于优 ...

  6. sip协议中文讲解

    https://blog.csdn.net/qiuchangyong/article/details/50748854

  7. 使用glusterfs 作为 kubernetes PersistentVolume PersistentVolumeClaim 持久化仓库,高可用Rabbitmq,高可用mysql,高可用redis

    glusterfs 怎么集群,网上一搜铺天盖地的 可利用这个特点做单节点高可用,因为K8S 哪怕节点宕机了 master 会在随意一台节点把挂掉的复活 当然我是在自己的环境下跑,经过网络的gluste ...

  8. vb编程中的选择结构语句的写法

    1996年,Bohra和Jacopin提出了结构化算法的3中种基本结构:顺序结构.选择结构和循环结构 目前已经得到证明,无论多么复杂的程序,都是由上面的3种基本结构中的一种或者多种的组合构成 在此笔者 ...

  9. thymeleaf入门和学习

    springboot框架不推荐使用jsp,一方面是兼容性的技术问题,一方面也是其前后端整合在一起,很难适合当下大规模的网站开发环境.HTML只是一种标记语言,并不具有获取model中数据的功能,所以视 ...

  10. ZooKeeper注册中心安装详细步骤(单节点)

    安装 Dubbo 注册中心 Dubbo 建议使用 Zookeeper 作为服务的注册中心. 注册中心服务器(192.168.3.71)配置,安装 Zookeeper: 1. 修改操作系统的/etc/h ...