Kafka学习笔记之为什么使用Kafka

kafka学习笔记（四）kafka的日志模块

概述日志段及其相关代码是 Kafka 服务器源码中最为重要的组件代码之一.你可能会非常关心,在 Kafka 中,消息是如何被保存和组织在一起的.毕竟,不管是学习任何消息引擎,弄明白消息建模方式都是首要的问题.因此,你非常有必要学习日志段这个重要的子模块的源码实现.今天,我会带你详细看下日志段部分的源码.不过在此之前,你需要先了解一下 Kafka 的日志结构日志是 Kafka 服务器端代码的重要组件之一,很多其他的核心组件都是以日志为基础的,比如后面要讲到的状态管理机和副本管理器等. 总的来说,…

ELK+Kafka学习笔记之搭建ELK+Kafka日志收集系统集群

0x00 概述关于如何搭建ELK部分,请参考这篇文章,https://www.cnblogs.com/JetpropelledSnake/p/9893566.html. 该篇用户为非root,使用用户为“elk”. 基于以前ELK架构的基础,结合Kafka队列,实现了ELK+Kafka集群,整体架构如下: # 1. 两台es组成es集群;( 以下对elasticsearch简称es ) # 2. 中间三台服务器就是我的kafka(zookeeper)集群啦; 上面写的消费者/生产者这是ka…

Kafka学习笔记（6）----Kafka使用Producer发送消息

1. Kafka的Producer 不论将kafka作为什么样的用途,都少不了的向Broker发送数据或接受数据,Producer就是用于向Kafka发送数据.如下: 2. 添加依赖 pom.xml文件如下:  <dependency> <groupId>org.apache.kafka</groupId> <artifa…

Kafka学习笔记（1）----Kafka的简介和Linux下单机安装

1. Kafka简介 Kafka is a distributed,partitioned,replicated commit logservice.它提供了类似于JMS的特性,但是在设计实现上完全不同,此外它并不是JMS规范的实现.kafka对消息保存时根据Topic进行归类,发送消息者成为Producer,消息接受者为Consumer,此外kafka集群有多个kafka实例组成,每个实例成为broker.无论是kafka集群,还是producer和consumer都依赖于zookeeper…

【kafka学习笔记】PHP接入kafka

安装扩展 # 先安装rdkfka库文件 git clone https://github.com/edenhill/librdkafka.git 或者: wget https://gitee.com/wanhedigital_1553363148/librdkafka/attach_files/619880/download/librdkafka-1.6.0.tar.gz -O librdkafka.tar.gz cd librdkafka/ ./configure make sudo make…

kafka学习笔记（三）kafka的使用技巧

概述上一篇随笔主要介绍了kafka的基本使用包括集群参数,生产者基本使用,consumer基本使用,现在来介绍一下kafka的使用技巧. 分区机制我们在使用 Apache Kafka 生产和消费消息的时候,肯定是希望能够将数据均匀地分配到所有服务器上.比如很多公司使用 Kafka 收集应用服务器的日志数据,这种数据都是很多的,特别是对于那种大批量机器组成的集群环境,每分钟产生的日志量都能以 GB 数,因此如何将这么大的数据量均匀地分配到 Kafka 的各个 Broker 上,就成为一个非常重…

kafka学习笔记（七）kafka的状态机模块

概述这一篇随笔介绍kafka的状态机模块,Kafka 源码中有很多状态机和管理器,比如之前我们学过的 Controller 通道管理器 ControllerChannelManager.处理 Controller 事件的 ControllerEventManager,等等.这些管理器和状态机,大多与各自的"宿主"组件关系密切,可以说是大小不同.功能各异.就比如 Controller 的这两个管理器,必须要与 Controller 组件紧耦合在一起才能实现各自的功能.不过,Kafka…

kafka学习笔记（六）kafka的controller模块

概述今天我们主要看一下kafka的controller的代码,controller代码是kafka的非常重要的代码,需要我们深入学习.从某种意义上来说,它是kafka最核心的组件,一方面,他要为集群中的所有主题分区选取领导者副本:另一方面,它还承载着集群的全部元数据信息,并负责讲这些元数据信息同步到其他broker上.下面我们来一一讲解controller组件. 集群元数据事实上,集群 Broker 是不会与 ZooKeeper 直接交互去获取元数据的.相反地,它们总是与 Controlle…

kafka学习笔记（五）kafka的请求处理模块

概述现在介绍学习一下kafka的请求处理模块,请求处理模块就是网络请求处理和api处理,这是kafka无论是对客户端还是集群内部都是非常重要的模块.现在我们对他进行源码深入探讨.当我们说到 Kafka 服务器端,也就是 Broker 的时候,往往会说它承担着消息持久化的功能,但本质上,它其实就是一个不断接收外部请求.处理请求,然后发送处理结果的 Java 进程. kafka请求队列高效地保存排队中的请求,是确保 Broker 高处理性能的关键.既然这样,那你一定很想知道,Broker 上的请…

kafka学习笔记（二）kafka的基本使用

概述第一篇随笔从消息队列的定义和各种应用,以及kafka的分类定义和基本知识,第二篇就写一篇关于kafka的基本实际配置和使用的随笔,包括kafka的集群参数的配置,生产者使用机制,消费者使用机制.总之我会使用由浅到深,由概括到具体的介绍kafka的每个功能. kafka集群的配置这里我只是介绍我认为比较重要的参数,当然也借鉴了网上多次提到的参数配置.严格来说这些配置并不单单指 Kafka 服务器端的配置,其中既有 Broker 端参数,也有主题(后面我用我们更熟悉的 Topic 表示)级别…

Kafka学习笔记之为什么使用Kafka

在介绍为什么使用kafka之前,我们有必要来了解一下什么是kafka? 0x00 什么是kafka Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用.目前越来越多的开源分布式处理系统如Storm,Spark,Flink都支持与Kafka集成.现在我们的数据实时处理平台也使用到了kafka.现在它已被多家不同类型的公司作为多种类型的数据管道和消息系统使用. 0x01 为什么使用消息系统上面我们提到kafka是一个分布式的消息系统.…

Kafka学习笔记（7）----Kafka使用Cosumer接收消息

1. 什么是KafkaConsumer? 应用程序使用KafkaConsul'le 「向Kafka 订阅主题,并从订阅的主题上接收消息.Kafka的消息读取不同于从其他消息系统读取数据,它涉及了一些独特的概念和想法. 1.1 消费者和消费者群组单个的消费者就跟前面的消息系统的消费者一样,创建一个消费者对象,然后订阅一个主题并开始接受消息,然后做自己的业务逻辑,但是Kafka天生就是支持体量很大的数据消费,如果只是使用单个的消费者消费消息,当生产者写入消息的速度远远大于了消费者的速度,大量消息堆…

Kafka学习笔记（5）----Kafka的Consumer

1. Pull vs Push Producer主动的通过push将消息发布到Broker上,Consumer通过Pull的的方式从Broker消息消息. 通过Push的方式由于是一有消息就推到Broker,所以极大的保证了消息实时性,但是在某些情况下,可能由于Consumer网络,或是其他原因倒是消费速度低,此时就可能会导致Consumer堆积大量的消息,甚至在极端情况下会压垮Consumer. 通过Pull拉取消息保证了Consumer能够按自己实际处理能力来拉取相应的消息,并且Broker…

Kafka学习笔记（4）----Kafka的Leader Election

1. Zookeeper的基本操作 zookeeper中的节点可以持久化/有序的两个维度分为四种类型: PERSIST:持久化无序(保存在磁盘中) PERSIST_SEQUENTIAL:持久化有序递增 EPHEMERAL:非持久化的无序的,保存在内存中,当客户端关闭后消失. EPHEMERAL_SEQUENTIAL:非持久有序递增,保存在内存中,当客户端关闭后消失每个节点都可以注册Watch操作,用于监听节点的变化,有四种事件类型如下: Created event: Enabled with…

Kafka学习笔记（3）----Kafka的数据复制（Replica）与Failover

1. CAP理论 1.1 Cosistency(一致性) 通过某个节点的写操作结果对后面通过其他节点的读操作可见. 如果更新数据后,并发访问的情况下可立即感知该更新,称为强一致性如果允许之后部分或全部感知不到该更新,称为弱一致性. 若在之后的一段时间(通常该时间不是固定的)后,一定可以感知到该更新,称为最终一致性. 1.2 Availability(高可用性) 即是任何一个没有发生故障的节点必须在有限的时间内返回合理的结果(不论是正确的还是错误的). 1.3 Partition toleran…

Kafka学习笔记（2）----Kafka的架构

1. 架构图一个Kafka集群中包含若干个Broker(消息实例),Kafka支持Broker横向扩展,Broker越多,吞吐量越大,同时也包含了若干个Producer(可以是web前端产生的Page View,或者是服务器日志,系统CPU.Memory等)和若干个Consumer(消费者)以及一个zookeeper集群,Kafka通过Zookeeper管理集群配置,选举leader,以及在Consumer Group发生变化时进行rebalance.Producer使用push模式将消息发布…

Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer

Kafka 学习笔记之 Kafka0.11之console-producer/console-consumer: 启动Zookeeper 启动Kafka0.11 创建一个新的Topic: ./kafka-topics.sh --create --zookeeper hadoop1:2181,hadoop2:2181,hadoop3:2181 --replication-factor 1 --partitions 3 --topic Topic011 查询Topic列表: ./kafka-topi…

大数据 -- kafka学习笔记：知识点整理（部分转载）

一为什么需要消息系统 1.解耦允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多消息队列所采用的"插入-获取-删除"范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕. 3.扩展性因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可. 4.灵活性…

kafka学习笔记（一）消息队列和kafka入门

概述学习和使用kafka不知不觉已经将近5年了,觉得应该总结整理一下之前的知识更好,所以决定写一系列kafka学习笔记,在总结的基础上希望自己的知识更上一层楼.写的不对的地方请大家不吝指正,感激万分.第一篇介绍消息队列概况和kafka的入门知识. 消息队列系统首先说一下消息队列的含义,"消息系统"这个词是从英文翻译过来的,英文的名字是"Messaging System",稍微学习过英语基础的都知道要翻译成消息队列,但是也有一些大家觉得并不正确,因为它片面强调了消…

Flink学习笔记：Connectors之kafka

本文为<Flink大数据项目实战>学习笔记,想通过视频系统学习Flink这个最火爆的大数据计算框架的同学,推荐学习课程: Flink大数据项目实战:http://t.cn/EJtKhaz 1. Kafka-connector概述及FlinkKafkaConsumer(kafka source) 1.1回顾kafka 1.最初由Linkedin 开发的分布式消息中间件现已成为Apache顶级项目 2.面向大数据 3.基本概念: 1.Broker 2.Topic 3.Partition 4.Pro…

kafka学习笔记：知识点整理

一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多消息队列所采用的"插入-获取-删除"范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕. 3.扩展性: 因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可. 4.…

kafka学习笔记2:生产者

这次的笔记主要记录一下kafka的生产者的使用和一些重要的参数. 文中主要截图均来自kafka权威指南主要涉及到两个类KafkaProducer和ProducerRecord. 总览生产者的主要架构如下: 首先创建了一个ProducerRecord 进行序列化 kv变为ByteArray 进入Partitioner 如果之前指定了分区那这一步什么都不会做接着将Record放入要被发送到的同样的topic和分区的batch中另一个单独的thread会进行发送操作发送成功会返回Recor…

kafka学习笔记——基本概念与安装

Kafka是一个开源的,轻量级的.分布式的.具有复制备份.基于zooKeeper协调管理的分布式消息系统. 它具备以下三个特性: 能够发布订阅流数据: 存储流数据时,提供相应的容错机制当流数据到达时,能够被及时处理. 首发于个人博客网站:链接地址下载安装本次安装只介绍在linux环境下,windows的暂时不考虑. 下载作为一个消息中间件,kafka并不是一个jar包,而是一个完整的应用,所以直接取官网下载部署包. 下载地址:https://kafka.apache.org/downlo…

[Big Data - Kafka] kafka学习笔记：知识点整理

Kafka学习笔记（三）——架构深入

之前搭建好了Kafka的学习环境,了解了具体的配置文件内容,并且测试了生产者.消费者的控制台使用方式,也学习了基本的API.那么下一步,应该学习一下具体的内部流程~ 1.Kafka的工作流程大致的工作流程图如下: 如图所示哈,整个工作环境包括:一个生产者(producer),一个消费者组(含有三个消费者),一个主题:A,三个节点(broker),三个分区(partition)和两个副本(副本数=leader数+follower数). 分析一下大致工作流程: Producer是消息的生产者,首先…

kafka学习笔记（二）——基础入门

1.集群规划从官网下载jar包 http://kafka.apache.org/downloads.html,我选择的是kafka_2.11-0.11.0.0.tgz版本规划一下集群环境先~ hadoop102 hadoop103 hadoop104 zk zk zk kafka kafka kafka 2.集群部署 1)解压安装包 [simon@hadoop102 software]$ tar -zxvf kafka_2.11-0.11.0.0.tgz -C /opt/module/ 2)…

kafka学习笔记（一）——概述

1.kafka是什么? 官方说明是: Kafka是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域. 提到了两个概念: 发布/订阅模式消息队列下边来理解一下这两个名词. 2.消息队列(Message Queue) 2.1 什么是消息队列? 两个单词简写一下就是MQ,抛开消息不看,那就只剩队列了. 队列:是一种先进先出(FIFO)的数据结构.数据结构课程中有涉及这个概念~ 消息队列可以简单理解为:把要传输的数据放在队列中. 我们把放消息的叫做:生产者:取消息的叫做:消费者…

KafKa——学习笔记

学习时间:2020年02月03日10:03:41 官网地址 http://kafka.apache.org/intro.html kafka:消息队列介绍: 近两年发展速度很快.从1.0.0版本发布就进步很快了. Scala语言:kafka的核心代码使用Scala语言编写接下来,主要学习springboot如何使用kafka完成消息的接收和发送. 需要学习kafka和基本使用使用SpringBoot整合kafka 通过阅读官方文档来进行学习 Introduction Kafka is use…

Kafka学习笔记

一.Kafka使用背景 1. Kafka的定义是一个分布式消息系统,由LinkedIn使用Scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础,具有高水平和高吞吐量. 2. ActiveMQ.RabbitMQ.Kafka 二.Kafka的相关概念 1. AMQP协议 producer---push--->broker <---pull--- consumer 一些基本的概念 (1)消费者(consumer):从消息队列中…

【Apache Kafka】Kafka学习笔记

0x00 基本信息 1.Kafka架构图 2.环境信息服务器IP:xx.xx.xx.xx 操作系统:CentOS7.2_x64 Kafka版本:kafka_2.12-1.1.0 Zookeeper版本:zookeeper-3.4.12 0x01 让Kafka运行起来 1.先启动Zookeeper $ cd /opt/kafka/zookeeper-/bin $ zkServer.sh start 确认zookeeper是否成功启动: $ netstat -an | tcp6 ::: :::*…

【Kafka学习笔记之为什么使用Kafka】的更多相关文章