kafka是JMS的一种实现

JMS(java message service):middle ware,中间件技术。
Queue:队列模式,P2P,点对点。
publish-subscribe:主题模式,发布订阅模式。

消息中间件具体了解点这里

kafka--分布式流计算平台

类似于消息系统发布订阅数据流。
以分布式、副本集群方式存储数据流。
实时处理数据流。

构建实时数据流管道,水平可伸缩,容错,速度快。

kafka特点

1.巨量数据:TB级
2.高吞吐量:支持每秒百万消息
3.分布式:支持在多个server之间进行消息分区
4.多客户端支持:和多语言进行协同。

kafka是消息系统,组件

zk //协同系统
broker //代理,即kafka server,并不维护哪个消费者消费了消息
producter //生产者
consumer //消费者,维护了消费的消息状态
consumer group //消费者组,每个组中只有一个消费者可以消费消息。
topic //主题

kafka的核心设计

1.消息缓存于FileSystem的存储,数据被即刻写入OS内核页,并缓存以及清理磁盘(可以配置)。
2.消息被消费后,kafka长时间驻留消息,如有必要,可以实现重复消费。
3.对分组消息使用消息set,防止网络过载。
4.不像大多数消息系统那样,将消费消息的元数据保存在server,而是将其保存在消费者。这样可以解决一些问题,比如:松散消息导致出错;相同消息的多次分发。
5.消费者状态默认存在zk中,也可以存在其它的OLTP中。
6.kafka中的生产和消费是push-and-pull模式(推拉模式,生产者push消息到broker中,消费者从broker中pull消息出来)。
7.kafka没有主从模式,所有broker地位相同,broker数据均在zk中维护,并在producter和consumer中共享。
8.kafka的LB(load balance,负载均衡)策略允许producer动态发现broker。
9.producer维护了broker的连接池,并能够通过zk的watcher call机制实时进行更新。
10.producer可以选择同步或异步的方式向broker发送消息。

消息压缩

1.producer压缩消息(GZIP + snappy),consumer解压缩。
2.压缩的消息没有深度限制。
3.在message的header中有一个compression byte来区分消息是否被压缩,这个压缩字节的低2位代表压缩类型,值为0表示未压缩。
4.消息压缩机制对于使用kafka进行跨数据中心建立数据镜像非常有用,压缩格式可以降低网络带宽,使一个active数据中心能向一个passive数据中心传输大量数据。

kafka镜像

将源集群的数据副本化到target kafka集群

kafka2 简单介绍的更多相关文章

  1. [原创]关于mybatis中一级缓存和二级缓存的简单介绍

    关于mybatis中一级缓存和二级缓存的简单介绍 mybatis的一级缓存: MyBatis会在表示会话的SqlSession对象中建立一个简单的缓存,将每次查询到的结果结果缓存起来,当下次查询的时候 ...

  2. 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍

    一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...

  3. 利用Python进行数据分析(4) NumPy基础: ndarray简单介绍

    一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 ...

  4. yii2的权限管理系统RBAC简单介绍

    这里有几个概念 权限: 指用户是否可以执行哪些操作,如:编辑.发布.查看回帖 角色 比如:VIP用户组, 高级会员组,中级会员组,初级会员组 VIP用户组:发帖.回帖.删帖.浏览权限 高级会员组:发帖 ...

  5. angular1.x的简单介绍(二)

    首先还是要强调一下DI,DI(Denpendency Injection)伸手获得,主要解决模块间的耦合关系.那么模块是又什么组成的呢?在我看来,模块的最小单位是类,多个类的组合就是模块.关于在根模块 ...

  6. Linux的简单介绍和常用命令的介绍

    Linux的简单介绍和常用命令的介绍 本说明以Ubuntu系统为例 Ubuntu系统的安装自行百度,或者参考http://www.cnblogs.com/CoderJYF/p/6091068.html ...

  7. iOS-iOS开发简单介绍

    概览 终于到了真正接触IOS应用程序的时刻了,之前我们花了很多时间去讨论C语言.ObjC等知识,对于很多朋友而言开发IOS第一天就想直接看到成果,看到可以运行的IOS程序.但是这里我想强调一下,前面的 ...

  8. iOS开发多线程篇—多线程简单介绍

    iOS开发多线程篇—多线程简单介绍 一.进程和线程 1.什么是进程 进程是指在系统中正在运行的一个应用程序 每个进程之间是独立的,每个进程均运行在其专用且受保护的内存空间内 比如同时打开QQ.Xcod ...

  9. iOS开发UI篇—UITabBarController简单介绍

    iOS开发UI篇—UITabBarController简单介绍 一.简单介绍 UITabBarController和UINavigationController类似,UITabBarControlle ...

随机推荐

  1. PHP文件解密服务,微擎微赞模块解密,微擎模块解密

    支持Zend/PHP5.3, Zend/PHP5.4, Zend/PHP5.5, Zend/PHP5.6解密 支持IonCube8, IonCube9, IonCube10解密 支持魔方一代,魔方二代 ...

  2. SpringBoot------如何将项目打成war包

    1.修改pom.xml文件 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http:/ ...

  3. linux(centos) 添加系统环境变量

    系统环境变量,其实就就是一个添加至系统环境中的路径变量. 编译php的扩展时经常会在扩展包源码目录里执行phpize,每次执行的时候都要敲入一大堆目录,诸如:/usr/local/php/bin/ph ...

  4. linux命令学习(6):ps命令

    Linux中的ps命令是Process Status的缩写.ps命令用来列出系统中当前运行的那些进程.ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信 ...

  5. 7.13python多进程

    所以引入了     多进程*(异步) 处理效率高 #!/usr/bin/env python #!--*--coding:utf-8 --*-- #!@Time :2018/7/13 19:26 #! ...

  6. I - A/B

    要求(A/B)%9973,但由于A很大,我们只给出n(n=A%9973)(我们给定的A必能被B整除,且gcd(B,9973) = 1). Input 数据的第一行是一个T,表示有T组数据. 每组数据有 ...

  7. Centos 7上Docker私有仓库Registry实战

    1. 关于Registry 官方的Docker hub是一个用于管理公共镜像的好地方,我们可以在上面找到我们想要的镜像,也可以把我们自己的镜像推送上去.但是,有时候,我们的使用场景需要我们拥有一个私有 ...

  8. webpack 配置

    https://segmentfault.com/a/1190000009454172

  9. jquery-1.11.2.min.js

    /*! jQuery v1.11.2 | (c) 2005, 2014 jQuery Foundation, Inc. | jquery.org/license */ !function(a,b){& ...

  10. javascript与java正则表达式写法的区别

    Js验证写法:(转义符\) var str = "待验证文本"; var regular = new RegExp(/这里是正则表达式/); if (regular.test(st ...