一、地址

1、实时更新的思维导图

https://www.mubucm.com/doc/4uqlpedefuj

2、图片

二、具体内容

5.producer生产者
- demo
  - 发送pro.send(new ProducerRecord<String,String>("test","123"))
  - ProducerRecord的属性
    
    重载方法234
    
    只topic和内容
    
    多key
    
    hash(key)确定发送的分区
    
    多key和partition
    
    key不起作用，发到指定分区
    
    topic
    
    partiton
    
    headers
    
    K
    
    用于hash计算分区
    
    V
    
    发送的消息值
    
    timestamp
  - ack应答机制
    
    用于保证数据发送可靠
- 必要参数
  - bootstrap.servers：整个集群的地址
- 发送模式
  - 发后即忘
    
    producer.send(rcd)
  - 同步发送sync
    
    send(rcd).get()
  - 异步发送async
    
    send(rcd,new CallBack(){onCompletion(){xxxx}})
6.consumer消费者
- demo
  - 订阅多个topic
  - poll(time超时时间)获取消息ConsumerRecord
  - record包含的内容.get
    
    offset
    
    key
    
    value
- 必要参数
  - group id
  - bootstrap.servers
    
    无需设置整个集群，只需设置单个
- 消息订阅
  - subscribe订阅
    
    重载方法*4
    
    ConsumerRebalanceListener再均衡监听器？
    
    方式
    
    指定集合方式
    
    正则方式订阅
    
    传参Pattern.compile("ods_*")
  - assign订阅
    
    consumer.assign(Collection<TopicPartition> collection)
    
    可以手动订阅多个topic的指定分区
    
    单个：Arrays.asList(new TopicPartition("topic1",0))
  - 区别
    
    粒度
    
    topic粒度（group管理）
    
    topic-partition粒度（自己管理）
    
    是否具有rebalance分区再均衡功能
  - 取消订阅
    
    consumer.unsubscribe()
    
    subscribe(new ArrayList<T>())
    
    String
    
    TopicPatition
- 消费模式
  - 拉取模式poll(time)
    
    time为阻塞时间（多久拉一次）
    
    设置为Long.MAX_VALUE，可以提高吞吐率
  - 消息类型ConsumerRecord
    
    ConsumerRecords<String,String> records=consumer.poll(100)
    
    ConsumerRecord rd=records.record(new TopicPartition("topic1",0))
- 提交偏移量
  - 指定位移消费
    
    consumer.seek(TopicPartition,offset)
  - 自动提交
    
    两个配置
    
    auto.commit
    
    interval.ms
    
    到点提交各分区最大位移
    
    默认true,5000
    
    存在问题
    
    重复消费
    
    消费者崩溃
    
    丢失消息
    
    拉取消息放入阻塞队列BlockingQueue
    
    阻塞队列的处理线程异常，从上次提交的位移处消费
    
    即实际消费到了3，已经提交了6
  - 手动提交
    
    调用API实现
    
    关闭自动提交：auto.commit设为false
    
    类型
    
    同步提交
    
    commitSync()-处理完提交（提交和拉取会阻塞）
    
    含参commitAsync(Map<TopicPatition,OffsetAndMetaData>)
    
    record获取offset，+1后作为Meta构造参数
    
    提交的偏移量是消费完record的偏移量+1
    
    异步提交
    
    提交和拉取不会阻塞，提高消费者性能
    
    重载的commitAsync
    
    commitAsync()
    
    commitAsync(OffsetCommitCallback)-带回调
    
    commitAsync(Map<TopicPatition,OffsetAndMetaData>,OffsetCommitCallback)-指定分区&偏移量+回调
    
    手动提交的时机
    
    处理完成前提交
    
    存在漏处理（数据丢失）
    
    实现了at most once语义
    
    处理完成后提交
    
    存在重复处理/消费（数据重复）
    
    原因：处理后提交前出bug
    
    实现了at least once语义
    
    理想语义：Exactly once（精确一次）
    
    ★通过kafka的事务机制实现
  - 提交方式总结
    
    全自动
    
    半自动
    
    全手动
    
    提交的位置：__consumer_offset
- 重要参数介绍
  - 一次拉取的最大最小数据量
  - 拉取的最大等待时长
  - 每个分区拉取的最大数据量
  - 一次拉取的最大条数
  - 等待请求响应、闲置、重试间隔
  - 消息隔离级别：读未提交或已提交
    
    read_uncommit：能消费到LSO
    
    read_committed：可以消费到HW
  - 超时时长，超过认为消费者已离开cg
7.topic管理
- 工具类KafkaAdminClient
  - 用于集成内部系统，实现多功能的生态平台
  - 功能：管理broker、配置、ACL、管理topic
  - 创建方式：KafkaAdminClient.create(props)
- 列出主题
  - listTopics()
- 查看主题信息
  - describeTopics(Arrays.asList(xx,yy))
- 创建主题
  - createTopics(new NewTopic(name,replicaAssignment))
- 删除主题
  - deleteTopics(Arrays.asList(xx,yy))
- 其他管理
  - 动态参数管理
    
    修改配置：alterConfigs(Map<ConfigResource,Config>)
  - 分区管理
    
    新增分区：createPartitions(Map<String,NewPartitions> map)

以上内容整理于幕布文档

Kafka教程（二）API开发-生产者、消费者、topic的更多相关文章

Hadoop生态圈-Kafka的旧API实现生产者-消费者
Hadoop生态圈-Kafka的旧API实现生产者-消费者作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.旧API实现生产者-消费者 1>.开启kafka集群 [yinz ...
Hadoop生态圈-Kafka的新API实现生产者-消费者
Hadoop生态圈-Kafka的新API实现生产者-消费者作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
Kafka 教程(二)-安装与基础操作
单机安装 1. 安装 java 2. 安装 zookeeper [这一步可以没有,因为 kafka 自带了 zookeeper] 3. 安装 kafka 下载链接 kafka kafka 是 scal ...
使用Win32 API实现生产者消费者线程同步
使用win32 API创建线程,创建信号量用于线程的同步创建信号量语法例如以下 HANDLE semophore; semophore = CreateSemaphore(lpSemaphoreA ...
RabbitMQ入门学习系列(二)，单生产者消费者
友情提示我对我的文章负责,发现好多网上的文章没有实践,都发出来的,让人走很多弯路,如果你在我的文章中遇到无法实现,或者无法走通的问题.可以直接在公众号<爱码农爱生活 >留言.必定会再次 ...
【Windows】用信号量实现生产者-消费者模型
线程并发的生产者-消费者模型: 1.两个进程对同一个内存资源进行操作,一个是生产者,一个是消费者. 2.生产者往共享内存资源填充数据,如果区域满,则等待消费者消费数据. 3.消费者从共享内存资源取数据 ...
Python 使用python-kafka类库开发kafka生产者&消费者&客户端
使用python-kafka类库开发kafka生产者&消费者&客户端 By: 授客 QQ:1033553122 1．测试环境 python 3.4 zookeeper- ...
Kafka技术内幕读书笔记之（三）生产者——消费者：高级API和低级API——基础知识
1. 使用消费组实现消息队列的两种模式分布式的消息系统Kafka支持多个生产者和多个消费者,生产者可以将消息发布到集群中不同节点的不同分区上:消费者也可以消费集群中多个节点的多个分区上的消息 . 写 ...
centos7单机安装kafka，进行生产者消费者测试
[转载请注明]: 原文出处:https://www.cnblogs.com/jstarseven/p/11364852.html 作者:jstarseven 码字挺辛苦的..... 一.k ...
kafka集群搭建和使用Java写kafka生产者消费者
1 kafka集群搭建 1.zookeeper集群搭建在110, 111,112 2.kafka使用3个节点110, 111,112 修改配置文件config/server.properties ...

随机推荐

【gRPC】C++异步服务端优化版，多服务接口样例
官方的C++异步服务端API样例可读性并不好,理解起来非常的费劲,各种状态机也并不明了,整个运行过程也容易读不懂,因此此处参考网上的博客进行了重写,以求顺利读懂. C++异步服务端实例,详细注释版 g ...
Promtail Pipeline 日志处理配置
转载自:https://mp.weixin.qq.com/s?__biz=MzU4MjQ0MTU4Ng==&mid=2247492144&idx=1&sn=a1cc13a642 ...
Linux yum安装PostgreSQL9.6
PostgreSQL10版本的主从安装配置在 https://www.cnblogs.com/virtulreal/p/11675841.html 一.下载安装 1.创建PostgreSQL9.6的y ...
Python（一）转义字符及操作符
转义字符描述 \(在行尾时) 续航符 \\ 反斜杠符号 \' 单引号 \'' 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 转行 \v 纵向制表符 \t 横向 ...
文件内再分类到各txt文件
当老师叫我们帮他做事,比如文件内内容再分类,我们就可以建个面板,里面有各要导入文件按钮,先把分类内容copy下,再点按钮导入进txt文件就行啦. 以下为java代码,使用了tableLayout布局 ...
魔改xxl-job，彻底告别手动配置任务！
原创:微信公众号码农参上,欢迎分享,转载请保留出处. 哈喽大家好啊,我是Hydra. xxl-job是一款非常优秀的任务调度中间件,轻量级.使用简单.支持分布式等优点,让它广泛应用在我们的项目中,解 ...
CCS 2022 极客少年挑战赛 writeup
目录题目一DSDS 操作内容: 题目二 easy_re 操作内容: flag值: 题目三 1+1=all 解题过程题目一DSDS 操作内容: 开环境然后进入网址在网址后./目录进入目录得到个 ...
齐博X1-新建一个空模板并在后台选择
本节实际操作建立一个空模板,并且让后台识别,选择该风格先在index_style中建立一个目录,命名mystyle并上传我们在mystyle目录中建立一个info.php文件,代码如下:上传后,后台 ...
golang中的字符串
0.1.索引 https://waterflow.link/articles/1666449874974 1.字符串编码在go中rune是一个unicode编码点. 我们都知道UTF-8将字符编码为 ...
Spark基本知识
Spark基本知识 Spark 是一种基于内存的快速.通用.可扩展的大数据分析计算引擎. spark与hadoop的区别 Hadoop Hadoop 是由 java 语言编写的,在分布式服务器集群上存 ...

Kafka教程（二）API开发-生产者、消费者、topic

一、地址

1、实时更新的思维导图

2、图片

二、具体内容

Kafka教程（二）API开发-生产者、消费者、topic的更多相关文章

随机推荐

热门专题