kafka的安装及使用

前言花絮

今天听了kafka开发成员之一的饶军老师的讲座，讲述了kafka的前生今世。干货的东西倒是没那么容易整理出来，还得刷一遍视频整理，不过两个比较八卦的问题，倒是很容易记住了。
Q：为什么kafka使用了Scala进行开发？
A：因为当年主R正在学习Scala，所以就用Scala开发了。并且这是他的第一个Scala项目。也正是因为他也在学习阶段，所以写出来的代码都是按照Java的写法实现的，这也是为什么Java开发者也能很容易读懂源码的原因。
Q：为什么kafka叫kafka？
A：因为主R在开发kafka的时候正在看卡夫卡的《变形记》，所以没有多想就用了kafka这个名字。同时，因为kafka实际上是以日志的形式记录消息的，属于一个书写者，所以用一位作家的名字命名也是很契合的。

思考：大佬们开发东西真随意。

先来说下kafka是个什么东西，它是一个消息中间件框架，只负责发布--订阅（帮忙存东西的）

接着给大家看一张大致的kafka流程图

首先打个比方，kafka好比就是中央电视台，而中央电视台下面有很多节目，生产者就是制作节目的团队，而消费者就是我们观看这个节目的人，一开始在zookeeper创建一个节目，假设就叫cctv1，有了这个节目名后，我们就得请一个团队来填充这个节目，比如拉广告啊，放电视剧之类的数据，而我们消费者要观看这个节目的话就得需要zookeeper来授权给我们。中央电视台则只是存数据的，相当于一个中间人，和现在中介差不多个意思。

1. 下载kafka的安装包到电脑上并传输到Linux中的hadoop用户下

2. 将这个压缩包解压到hadoop用户的opt目录下

接着就会在opt目录下看到这个文件夹(/opt：这是给主机额外安装软件所摆放的目录。比如你安装一个ORACLE数据库就可以放到这个目录下。默认是空的。)

3. 进入到该目录下 /home/hadoop/opt/kafka_2.11-1.1.0/config目录，将 zookeeper.properties 中的信息筛选出来并将筛选出来的数据给一个新建的文件zk.properties

#把非注释行信息筛选出来

接着vi zk.properties这个文件，修改dataDir，将来zookeeper的信息都记录在这个目录下，即dataDir=/home/hadoop/zk/

4. 启动zookeeper

要在该/home/hadoop/opt/kafka_2.11-1.1.0目录下启动

./bin/zookeeper-server-start.sh config/zk.properties

接着我们复制该窗口，jps一下，就会看到新开的服务QuorumPeerMain（仲裁的一个机制的东西），这个东西就是zookeeper的进程

#jps 用于查看当前服务器中的java进程，类似于ps -ef | grep java，不同之处是它是由jdk提供的，可以输出JVM中运行的进程状态信息，因此它也可以用于jvm的监控和调优

5. 启动broker（kafka）

我们这个是单机模式：

进入该目录/home/hadoop/opt/kafka_2.11-1.1.0/config，和上面一样，将一个文件的数据重定向到另一个新目录，将带有#注释的代码去掉

cat server.properties | grep -v '#' >>kafka1.properties

然后启动kafka，要在bin目录下，和上面一样

./bin/kafka-server-start.sh config/kafka1.properties

启动了后，jps一下，就会发现启动了一个名叫Kafka的进程，说明我们已经启动成功了

6. 创建一个主题

这里相当于中央电视台创建了一个叫cctv1的节目

还是在/home/hadoop/opt/kafka_2.11-1.1.0目录下启动创建

sh ./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic cctv1 #创建到 zookeeper上地址是localhost:2181，cctv1是主题名

然后就可以用命令查看一下该主题是否已经创建，看到这个cctv1就说明创建成功了

sh ./bin/kafka-topics.sh --list --zookeeper localhost:2181

到这里就已经完成了kafka在zookeeper上创建了一个cctv1的主题,然后就需要一个生产者来制作节目，并往cctv1中灌入数据

7. 发布消息（生产者）

./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic cctv1

　这是一个kafka自带的控制台的消息者，这里要注意的一点是端口号为9092，说明这个东西默认监控的端口号是9092，我们可以来看下这个端口

查看server.properties这个文件

会看到箭头指向的地方有个注释，如果不想用这个端口，可以把这句前面的#去掉，然后将端口号改为自己想监控的端口号

也可以来查看下这个端口号，发现正在监控

#Linux netstat 命令用于显示网络状态。利用 netstat 指令可让你得知整个 Linux 系统的网络情况。

随机输入两条数据，并没有什么变化，因为这个数据borker（经理人）帮忙存着，但这个数据看不到，必须要有一个消费者帮忙消费才能看到

8. 启动消费者

相当于订阅了cctv1这个频道

./bin/kafka-console-consumer.sh--bootstrap-server localhost:9092 --topic cctv1

启动消费者后，并没有发生什么变化，这时候我们就在生产者中再输入几条消息

接着就会看到消费者那边出来了数据，但看到的数据只有刚刚输入的

那之前输入的数据怎么看？

输入这个命令就行了

./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic cctv1 --from-beginning

就是在启动消费者时后面加了一个 --from-beginning，就是说明这个cctv1电视台成数字电视台了，可以点播，可以看之前所有的信息，--from-beginning表示从开头开始看，其实它可以从任意一个偏移量开始看

随后再来实验一下，我们在生产者那里接着再输入多条数据

随后发现消费者也出来对应的数据

而我们刚刚启动查询所有的信息的那个服务里面也显示出相应的信息

注意：

zookeeper只能启动奇数，比如1台、3台、7台等等，不能偶数台，偶数台的话假设有两台，那么只有一台机器再运行，因为如果是偶数的话，选举出来的管理者有可能两个borker得到的票数相同，奇数的话就不会出现这个情况。

上面演示的是简单的操作，我们也可以在kafka上写如何放数据，如何读数据，全部用代码来实现。

参考：

https://blog.csdn.net/gscsd_t/java/article/details/80089269

https://blog.csdn.net/u011291072/article/details/80009928

kafka的安装及使用的更多相关文章

Kafka的安装和部署及测试
1.简介大数据分析处理平台包括数据的接入,数据的存储,数据的处理,以及后面的展示或者应用.今天我们连说一下数据的接入,数据的接入目前比较普遍的是采用kafka将前面的数据通过消息的方式,以数据流的形 ...
Linux下Kafka单机安装配置方法(图文)
Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了普通消息系统的功能,但具有自己独特的设计.这个独特的设计是什么样的呢介绍 Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了 ...
kafka的安装以及基本用法
kafka的安装 kafka依赖于ZooKeeper,所以在运行kafka之前需要先部署ZooKeeper集群,ZooKeeper集群部署方式分为两种,一种是单独部署(推荐),另外一种是使用kafka ...
kafka manager安装配置和使用
kafka manager安装配置和使用 .安装yum源 curl https://bintray.com/sbt/rpm/rpm | sudo tee /etc/yum.repos.d/bintra ...
kafka 的安装部署
Kafka 的简介: Kafka 是一款分布式消息发布和订阅系统,具有高性能.高吞吐量的特点而被广泛应用与大数据传输场景.它是由 LinkedIn 公司开发,使用 Scala 语言编写,之后成为 Ap ...
Kafka学习之路（四）Kafka的安装
一.下载下载地址: http://kafka.apache.org/downloads.html http://mirrors.hust.edu.cn/apache/ 二.安装前提(zookeepe ...
centos php Zookeeper kafka扩展安装
如题,系统架构升级引入消息机制,php 安装还是挺麻烦的,网上各种文章有的东拼西凑这里记录下来做个备忘,有需要的同学可以自行参考安装亲测可行 1 zookeeper扩展安装 1.安装zookeeper ...
Linux下Kafka单机安装配置方法
Kafka是一个分布式的.可分区的.可复制的消息系统.它提供了普通消息系统的功能,但具有自己独特的设计.这个独特的设计是什么样的呢? 首先让我们看几个基本的消息系统术语: •Kafka将消息以topi ...
Kafka Manager安装部署及使用
为了简化开发者和服务工程师维护Kafka集群的工作,yahoo构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager.本文对其进行部署配置,并安装配置kafkatool对k ...
【kafka】安装部署kafka集群（kafka版本：kafka_2.12-2.3.0）
3.2.1 下载kafka并安装kafka_2.12-2.3.0.tgz tar -zxvf kafka_2.12-2.3.0.tgz 3.2.2 配置kafka集群在config/server.p ...

随机推荐

activiti会签多实例例子
在实际的业务中,可能存在存在这么一种情况,当流程运行到某一个环节时,可能需要同时多个人的参与,才可以完成此环节.此时就可以用到activiti的多实例来解决此问题. 一.将一个节点设置成多实例的方法: ...
无网络下，配置yum本地源
1. 新建一个没有iso镜像文件的虚拟机: 2. 本地上传一个镜像文件(CentOS7的镜像),到虚拟机已创建的目录: 例如:上传一个镜像文件CentOS-7-x86_64-Everything-17 ...
Noip模拟31 2021.8.5
T1 Game 当时先胡了一发$\textit{Next Permutation}$... 然后想正解,只想到贪心能求最大得分,然后就不会了.. 然后就甩个二十分的走了... 正解的最大得分(叫它$k ...
六步教你如何用PADS进行PCB设计？
在使用PADS进行PCB设计的过程中,需要对印制板的设计流程以及相关的注意事项进行重点关注,这样才能更好的为工作组中的设计人员提供系统的设计规范,同时也方便设计人员之间进行相互的交流和检查. 02 设 ...
深入理解和运用Pandas的GroupBy机制——理解篇
GroupBy是Pandas提供的强大的数据聚合处理机制,可以对大量级的多维数据进行透视,同时GroupBy还提供强大的apply函数,使得在多维数据中应用复杂函数得到复杂结果成为可能(这也是个人认为 ...
nodejs 连接 mysql 查询事务处理
自己用 mysql 很多次的,然后又是主玩nodejs的.专门写一篇文章来说说nodejs连接mysql数据库.在使用之前,请检查计算机是否具有一下环境! nodejs 执行环境. mysql数据库环 ...
全面！总结BQ系列阻抗跟踪电量计化学Chemical ID配置和Golden学习方法
BQ系列阻抗跟踪电量计SOC最高能达到1%,功能强大,应用起来也比较复杂.不仅要配置好参数,匹配好化学ID,并且进行好Golden学习和相关测试.本文就讲述ID匹配,Golden学习和测试的终极方法流 ...
QuantumTunnel：Netty实现
接上一篇文章内网穿透服务设计挖的坑,本篇来聊一下内网穿透的实现. 为了方便理解,我们先统一定义使用到的名词: UserClient:用户客户端,真实的请求发起方: UserServer:内网穿透-用户 ...
【Java】IO流
File类介绍 File类的一个对象,代表一个文件或一个文件目录 File类声明在java.io包下 File类中涉及关于文件或文件目录的创建.删除.重命名.修改时间.文件大小等方法,并未涉及到写入 ...
IDEA安装热部署插件JRebel
首先说下热部署是什么意思吧,简单了说就是在我们对代码进行更改之后,不需要重启项目,重新编译一下就可以直接运行最新的代码的部署方式.既然是部署方式,项目启动部署的时候当然就会和正常情况下不一样啦~ JR ...

kafka的安装及使用

kafka的安装及使用的更多相关文章

随机推荐

热门专题