Hadoop生态圈-Kafka的本地模式部署

　　　　　　　　　　　　　　　　　　　　Hadoop生态圈-Kafka的本地模式部署

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

一.Kafka简介

1>.什么是JMS

　　答：在Java中有一个角消息系统的东西，我们叫他Java Message Service，简称JMS。比如各种MQ。

2>.JMS的两种工作模式

　　第一种模式：点到点（point to point,简称P2P），典型的一对一模式（一个人发送数据的同时只有一个人接收数据），也有人称之为端到端（peer to peer）。

　　第二种模式：发布订阅模式（publish subscribe，简称P-S），典型的一对多模式（一个人发送数据的同时可以有多个人接收数据）。

3>.Kafka的工作模式

　　答：Kafka的工作模式可以把JMS的两种模式结合在一起，我们称之为消费者组模式。

4>.什么是Kafka

　　答：Kafka和flume以及Sqoop一样，他们都是中间件（不含有业务的技术组件）。Kafka在官方定义是分布式消息系统。当然Kafka还可以用在做分布式数据库，除此之外，它还可以当做分布式缓存。

5>.ApacheKafka是一个分布式流媒体平台

　　ApacheKafka是一个分布式流媒体平台，这到底是什么意思呢？接下来我们看一下流媒体平台有三个关键功能如下：

　　　　第一：发布和订阅记录流，类似于消息队列或企业消息传递系统。

　　　　第二：以容错持久的方式存储记录流。

　　　　第三：处理记录发生的流。

6>.Kafka通常用于两大类应用

　　第一：构建可在系统或应用程序之间可靠获取数据的实时流数据管道。

　　第二：构建实时流应用程序，用于转换或响应数据流。

7>.kafka版本介绍

　　kafka起先由领英（linkedin创建）公司，开源后被Apache基金会纳入子项目。我们在下载Kafka时，你是如何区分它的版本呢？比如本篇博客下载kafka的版本是“kafka_2.11-1.1.0”，这个“2.11”是scala（java语言脚本化）版本而“1.1.0”是kafka版本。

二.Kafka本地模式部署

1>.下载Kafaka

　　下载地址：http://kafka.apache.org/downloads。

2>.解压并创建软连接

[yinzhengjie@s101 data]$ tar xzf kafka_2.11-1.1.0.tgz -C /soft/

[yinzhengjie@s101 data]$ ln -s /soft/kafka_2.11-1.1.0/ /soft/kafka

[yinzhengjie@s101 data]$

4>.配置环境变量并使之生效

[yinzhengjie@s101 data]$ sudo vi /etc/profile

[sudo] password for yinzhengjie:

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$ tail -3 /etc/profile

#ADD KafKa PATH

export KAFKA_HOME=/soft/kafka

PATH=$PATH:$KAFKA_HOME/bin

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$ source /etc/profile

[yinzhengjie@s101 data]$

5>.修改配置文件

[yinzhengjie@s101 data]$ sed -i 's@#listeners=PLAINTEXT://:9092@listeners=PLAINTEXT://s101:9092@g' /soft/kafka/config/server.properties

[yinzhengjie@s101 data]$ sed -i 's@log.dirs=/tmp/kafka-logs@log.dirs=/home/yinzhengjie/kafka/logs@g' /soft/kafka/config/server.properties

[yinzhengjie@s101 data]$ sed -i 's@zookeeper.connect=localhost:2181@zookeeper.connect=s102:2181,s103:2181,s104:2181@g' /soft/kafka/config/server.properties

[yinzhengjie@s101 data]$

6>.启动kafka

[yinzhengjie@s101 data]$ kafka-server-start.sh -daemon /soft/kafka/config/server.properties

[yinzhengjie@s101 data]$ echo $?

[yinzhengjie@s101 data]$ jps | grep Kafka

 Kafka

[yinzhengjie@s101 data]$ netstat -untalp | grep

(Not all processes could be identified, non-owned process info

 will not be shown, you would have to be root to see it all.)

tcp6              172.30.100.101:     :::*                    LISTEN      /java

tcp6              172.30.100.101:    172.30.100.101:     ESTABLISHED /java

tcp6              172.30.100.101:     172.30.100.101:    TIME_WAIT   -

tcp6              172.30.100.101:    172.30.100.101:     TIME_WAIT   -

tcp6              172.30.100.101:     172.30.100.101:    ESTABLISHED /java

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$

7>.停止kafka

[yinzhengjie@s101 data]$ jps | grep Kafka

 Kafka

[yinzhengjie@s101 data]$ netstat -untalp | grep

(Not all processes could be identified, non-owned process info

 will not be shown, you would have to be root to see it all.)

tcp6              172.30.100.101:     :::*                    LISTEN      /java

tcp6              172.30.100.101:    172.30.100.101:     ESTABLISHED /java

tcp6              172.30.100.101:     172.30.100.101:    TIME_WAIT   -

tcp6              172.30.100.101:    172.30.100.101:     TIME_WAIT   -

tcp6              172.30.100.101:     172.30.100.101:    ESTABLISHED /java

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$ kafka-server-stop.sh

[yinzhengjie@s101 data]$ jps | grep Kafka

[yinzhengjie@s101 data]$ netstat -untalp | grep

(Not all processes could be identified, non-owned process info

 will not be shown, you would have to be root to see it all.)

tcp6              172.30.100.101:    172.30.100.101:     TIME_WAIT   -

tcp6              172.30.100.101:     172.30.100.101:    TIME_WAIT   -

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$

三.kafka初体验

1>.启动kafka（提供服务）

[yinzhengjie@s101 data]$ kafka-server-start.sh -daemon /soft/kafka/config/server.properties

[yinzhengjie@s101 data]$ netstat -untalp | grep

(Not all processes could be identified, non-owned process info

 will not be shown, you would have to be root to see it all.)

tcp6              172.30.100.101:     :::*                    LISTEN      /java

tcp6              172.30.100.101:     172.30.100.101:    ESTABLISHED /java

tcp6              172.30.100.101:    172.30.100.101:     ESTABLISHED /java

[yinzhengjie@s101 data]$ jps | grep Kafka

 Kafka

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$ kafka-server-start.sh -daemon /soft/kafka/config/server.properties

2>.创建主题（消息保管者）

[yinzhengjie@s101 data]$ kafka-topics.sh --zookeeper s102: --create  --partitions  --replication-factor   --topic yinzhengjie

Created topic "yinzhengjie".

[yinzhengjie@s101 data]$

[yinzhengjie@s101 data]$ kafka-topics.sh --zookeeper s102:2181 --create --partitions 2 --replication-factor 1 --topic yinzhengjie

3>.启动生产者（消息发送方）

[yinzhengjie@s101 data]$ kafka-console-producer.sh --broker-list s101: --topic yinzhengjie

>My name is yinzhengjie , I love Beijing!

>

[yinzhengjie@s101 data]$ kafka-console-producer.sh --broker-list s101:9092 --topic yinzhengjie

4>.启动消费者（消息接收方）

[yinzhengjie@s101 lib]$ kafka-console-consumer.sh --zookeeper s102: --topic yinzhengjie --from-beginning

Using the ConsoleConsumer with old consumer is deprecated and will be removed in a future major release. Consider using the new consumer by passing [bootstrap-server] instead of [zookeeper].

My name is yinzhengjie , I love Beijing!

[yinzhengjie@s101 lib]$ kafka-console-consumer.sh --zookeeper s102:2181 --topic yinzhengjie --from-beginning

Hadoop生态圈-Kafka的本地模式部署的更多相关文章

Hadoop生态圈-Kafka的完全分布式部署
Hadoop生态圈-Kafka的完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客主要内容就是搭建Kafka完全分布式,它是在kafka本地模式(https:/ ...
Hadoop生态圈-通过CDH5.15.1部署spark1.6与spark2.3.0的版本兼容运行
Hadoop生态圈-通过CDH5.15.1部署spark1.6与spark2.3.0的版本兼容运行作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 在我的CDH5.15.1集群中,默 ...
一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）
1)集群规划:主机名 IP 安装的软件运行的进程master 192.168.199.130 jdk.hadoop ...
Hadoop生态圈-kafka事务控制以及性能测试
Hadoop生态圈-kafka事务控制以及性能测试作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
Hadoop生态圈-Kafka的新API实现生产者-消费者
Hadoop生态圈-Kafka的新API实现生产者-消费者作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
Hadoop生态圈-Kafka配置文件详解
Hadoop生态圈-Kafka配置文件详解作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.默认kafka配置文件内容([yinzhengjie@s101 ~]$ more /s ...
Hadoop生态圈-Kafka的旧API实现生产者-消费者
Hadoop生态圈-Kafka的旧API实现生产者-消费者作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.旧API实现生产者-消费者 1>.开启kafka集群 [yinz ...
Hadoop生态圈-Kafka常用命令总结
Hadoop生态圈-Kafka常用命令总结作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.管理Kafka服务的命令 1>.开启kafka服务 [yinzhengjie@s ...
【Hadoop】Hadoop的安装，本地模式、伪分布模式的配置
Download hadoop-2.7.7.tar.gz 下载稳定版本的hadoop-2.7.7.tar.gz(我用的2.6.0,但是官网只能下载2.7.7的了) Required Software ...

随机推荐

利用Github搭建自己的博客
教程链接:搭建个人博客嘿嘿嘿!!一直想自己搭建博客的,一直没机会,这次终于把博客搭了起来.虽然只是一个壳子..套了别人的模板~不过还是很令人兴奋哟!总的来说,就按照这个教程一直往下走,其中有一个坑就 ...
django请求的生命周期
1. 概述首先我们知道HTTP请求及服务端响应中传输的所有数据都是字符串. 在Django中,当我们访问一个的url时,会通过路由匹配进入相应的html网页中. Django的请求生命周期是指当用户 ...
部署AlwaysOn第三步：集群资源组的健康检测和故障转移
资源组是由一个或多个资源组成的组,WSFC的故障转移是以资源组为单位的,资源组中的资源是相互依赖的.一个资源所依赖的其他资源必须和该资源处于同一个资源组,跨资源组的依赖关系是不存在的.在任何时刻,每个 ...
Scrapy爬虫入门实例
网上关于Scracpy的讲述已经非常丰富了,而且还有大神翻译的官方文档,我就不重复造轮子了,自己写了一个小爬虫,遇到不少坑,也学到不少东西,在这里给大家分享一下,自己也做个备忘录. 主要功能就是爬取c ...
蓝牙学习笔记二（Android连接问题）
可以通过以下两点加速蓝牙连接: 1.更新连接参数 interval:连接间隔(connection intervals ),范围在 7.5 毫秒到 4 秒. latency:连接延迟 ... 还有一 ...
Synchronous/Asynchronous：任务的同步异步，以及asynchronous callback异步回调
两个线程执行任务有同步和异步之分,看了Quora上的一些问答有了更深的认识. When you execute something synchronously, you wait for it to ...
grunt-inline：一个资源内嵌插件
一.插件简介将引用的外部资源,如js.css.img等,内嵌到引用它们的文件里去. 二.使用场景在项目中,出于某些原因,有的时候我们需要将一些资源,比如js脚本内嵌到页面中去.比如我们的html页 ...
Mvc4_mvc4跟mysql语法
mvc4: 子页面:@section A{} 母页面:@RenderSection("A",false) false:别的页面没有定义为A的Section的话也没事,layout ...
kubernetes 网络故障遇见的坑
1.记录一下自己搭建kubernetes 集群遇见的坑. 过程是我学技术以来最大的bug,处处都是坑,稍微写成一点, 就完全起不来, 起不来之后, 还找不到故障点, 郁闷之极. 后续会慢慢分享给大家. ...
李群与李代数在slam中的应用
昨天,刚接触道了李群和李代数,查了许多资料,也看了一些视屏.今天来谈谈自己的感受. 李群是有一个挪威数学家提出的,在十九二十世纪得到了很大的发展. 其归于非组合数学,现在简单介绍李群和李代数的概念.群 ...

Hadoop生态圈-Kafka的本地模式部署

Hadoop生态圈-Kafka的本地模式部署的更多相关文章

随机推荐

热门专题