kafka相关操作

kafka安装

下载

wget http://apache.gree.com/apache/kafka/1.0.2/kafka_2.11-1.0.2.tgz

tar -zxvf kafka_2.11-1.0.2.tgz -C /usr/local/

mv /usr/local/kafka_2.11-1.0.2 /usr/local/kafka

cd /usr/local/kafka/config/

vi server.properties

broker.id=0 这里的id每个kafka的id都是唯一的

host.name=10.2.xxx.xx 设置当前机器的IP

zookeeper.connect=10.2.xxx.xx:2181,10.2.xx.xxx:2181,10.2.xxx.xx:2181 设置zookeeper的地址

log.dirs=/tmp/kafka0-logs 设置日志地址，不同机器上的地址可能需要区别一下，避免broker启动不起来

其他节点配置类似

kafka指令

启动kafka

/usr/local/kafka/bin/kafka-server-start.sh --daemon /usr/local/kafka/config/server.properties 1>/dev/null 2>&1 &

添加--daemon让kafka在后台以守护进程的方式启动，不会自动停掉

创建topic,名为netSwitch ,分区数为3（--partition 3）,总备份数为2（--replication-factor 2）,备份数不可超过机器的数量，分区数可以大于机器的数量

/usr/local/kafka/bin/kafka-topics.sh --create --zookeeper HDP-master,HDP-slave1,HDP-slave2 --replication-factor 2 --partitions3 --topic netSwitch

kafka-topics --create --zookeeper HDP-master --replication-factor 2 --partitions3 --topic netSwitch

查看topic的描述

/usr/local/kafka/bin/kafka-topics.sh --describe --zookeeper HDP-master,HDP-slave1,HDP-slave2 --topic netSwitch

Topic:netSwitch PartitionCount:3 ReplicationFactor:2

Topic:netSwitch Partition:0 Leader:2 Replicas: 2,0 Isr: 2,0

Topic:netSwitch Partition:1 Leader:0 Replicas: 0,1 Isr: 0,1

Topic:netSwitch Partition:2 Leader:1 Replicas: 1,2 Isr: 1,2

其中Leader表示数据所在节点，在其他节点上的数据为备份数据

列出所有topic

/usr/local/kafka/bin/kafka-topics.sh --list --zookeeper HDP-master,HDP-slave1,HDP-slave2

kafka的topic数据保存在之前配置的日志文件目录下(server.properties文件中log.dirs的值，默认为/tmp/kafka0-logs)，如果要删除某个topic,需要删除日志目录下对应的文件夹

查看已注册到zookeeper中的broker个数

/usr/lcoal/zookeeper/bin/zkCli.sh 进入zookeeper命令行

ls /brokers/ids 列出已注册的brokers的id

out:[1,2] id为1,2的节点注册正常，0节点异常？

quit 退出zookeeper命令行

当部分broker注册异常时可尝试修改log.dirs的值为不同目录名后正常启动

修改topic的分区数

kafka-topics --alter --zookeeper 10.4.56.22:9013/kafka --topic eSafenet --partitions 4

修改topic的备份数（将已有数据进行重新分布配置）

(1)查看topic的分区备份情况

/usr/local/kafka/bin/kafka-topics.sh --describe --zookeeper HDP-master,HDP-slave1,HDP-slave2 --topic netSwitch

Topic:netSwitch PartitionCount:3 ReplicationFactor:1

Topic:netSwitch Partition:0 Leader:2 Replicas: 2 Isr: 2

Topic:netSwitch Partition:1 Leader:0 Replicas: 0 Isr: 0

Topic:netSwitch Partition:2 Leader:1 Replicas: 1 Isr: 1

(2)根据分区备份信息，编辑新的配置

vi ./increase-replication-factor.json

{"version":1,

"partitions":[

{"topic":"netSwitch","partition":0,"replicas":[2,0]},

{"topic":"netSwitch","partition":1,"replicas":[0,1]},

{"topic":"netSwitch","partition":1,"replicas":[1,2]}

]}

kafka-reassign-partitions --zookeeper HDP-master --reassignment-json-file ./increase-replication-factor.json --execute

(3)查看重分配的执行情况

kafka-reassign-partitions --zookeeper HDP-master --reassignment-json-file ./increase-replication.json --verify

清空topic中的数据

kafka-topics --zookeeper HDP-master --delete --topic netSwitch

发送消息到broker (生产者)

/usr/local/bin/kafka-console-producer.sh --broker-list HDP-master:9092 --topic netSwitch

>this is the first hdp-master test message

>this is the second hdp-master test message

>three of it

^c ctrl+c 退出并发送消息

从broker消费消息（消费者）

/usr/local/bin/kafka-console-consumer.sh --zookeeper HDP-master,HDP-salve1,HDP-slave2 --from-beginning --topic netSwitch

this is the first hdp-master test message

three of it

this is the second hdp-master test message

kafka-console-consumer --bootstrap-server 10.2.24.15:9092 --topic netSwitch

可以看出消费kafka的topic数据时，不一定是按顺序来的，因为这些数据在不同的partition分区，kafka只能保证同一分区上的数据是按顺序读取的，

可以通过某种方式，设置某一类型的数据被发送到同一分区。

kafka相关操作的更多相关文章

kafka的相关操作脚本
总结最近用到的kafka相关命令和脚本. 1.创建Topic./kafka-topics.sh --zookeeper cc13-141:2182 --topic mytopic --replicat ...
简单封装kafka相关的api
一.针对于kafka版本 <dependency> <groupId>org.apache.kafka</groupId> <artifactId>ka ...
Kafka学习笔记之Kafka自身操作日志的清理方法(非Topic数据)
0x00 概述本文主要讲Kafka自身操作日志的清理方法(非Topic数据),Topic数据自己有对应的删除策略,请看这里. Kafka长时间运行过程中,在kafka/logs目录下产生了大量的ka ...
Spark-读写HBase，SparkStreaming操作，Spark的HBase相关操作
Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作 1.sparkstreaming实时写入Hbase(saveAsNewAPIHadoopDataset方法 ...
从零自学Hadoop(20)：HBase数据模型相关操作上
阅读目录序介绍命名空间表系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
从零自学Hadoop(21)：HBase数据模型相关操作下
阅读目录序变量数据模型操作系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
理解CSV文件以及ABAP中的相关操作
在很多ABAP开发中,我们使用CSV文件,有时候,关于CSV文件本身的一些问题使人迷惑.它仅仅是一种被逗号分割的文本文档吗? 让我们先来看看接下来可能要处理的几个相关组件的词汇的语义. Separat ...
Liunx下的有关于tomcat的相关操作 && Liunx 常用指令
先记录以下liunx下的有关于tomcat的相关操作查看tomcat进程: ps-ef|grep java (回车) 停止tomcat进程: kill -9 PID (进程号如77447) (回车) ...
pip的相关操作
>Python中的pip是什么?能够做些什么? pip是Python中的一个进行包管理的东西,能够下载包.安装包.卸载包......一些列操作 >怎么查看pip的相关信息在控制台输入: ...

随机推荐

xadmin进行全局配置（修改模块名为中文以及其他自定义的操作步骤）
1.实现自定义配置和收缩: 在apps->users->adminx.py中操作如下图内容 2.改成中文操作如下图所示: 图1: 图2: run重启,刷新页面即可实现如下图: 接下来 ...
.Net Core 3.0开源可视化设计CMS内容管理系统建站系统
简介 ZKEACMS,又名纸壳CMS,是可视化编辑设计的内容管理系统.基于.Net Core开发可跨平台运行,并拥有卓越的性能. 纸壳CMS基于插件式设计,功能丰富,易于扩展,可快速创建网站. 布局设 ...
Linux—系统管理
查看Linux系统版本 CentOS系统 # centos7查看命 ...
Python对Redis增删改查
pip install redis import redis # 连接redis # 几个常用默认参数: # host='localhost', port=6379, db=0, decode_res ...
Python语法速查： 5. 运算符、math模块、表达式
返回目录 (1)一些较容易搞错的运算符一般简单的如加减乘除之类的运算符就不写了,这里主要列些一些容易搞错或忘记的运算符.运算符不仅仅只有号,有一些英文单词如 in, and 之类,也是运算符,并不是 ...
[Linux] 安装grafana并且添加influxdb监控
安装grafana,官网提供了ubuntu的安装包,直接进行安装 wget https://dl.grafana.com/oss/release/grafana_6.5.1_amd64.deb dpk ...
acwing 7 混合背包
习题地址 https://www.acwing.com/problem/content/description/7/ 题目描述有 N 种物品和一个容量是 V 的背包. 物品一共有三类: 第一类物品只 ...
acwing 66. 两个链表的第一个公共结点
地址 https://www.acwing.com/problem/content/description/62/ 输入两个链表,找出它们的第一个公共结点. 当不存在公共节点时,返回空节点. 样例给 ...
web系统测试策略
1.按系统架构可分为: 客户端测试.服务器端测试.网络上测试 2.按职能可分为: 应用功能的测试.web应用服务的测试.安全系统的测试.数据库服务的测试 3.按软件质量特性: (1)功能测试链接测试 ...
Leetcode103_Binary-tree-zigzag-level-order-traversal
原题: https://leetcode-cn.com/problems/binary-tree-zigzag-level-order-traversal/ 思路,如果无从下手,先要了解二叉树的广度优 ...

kafka相关操作

kafka相关操作的更多相关文章

随机推荐

热门专题