高吞吐量的分布式发布订阅消息系统Kafka--安装及测试

一、Kafka概述

Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop的一样的日志数据和离线分析系统，但又要求实时处理的限制，这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理，也是为了通过集群机来提供实时的消费。

二、Kafka相关术语

Broker

Kafka集群包含一个或多个服务器，这种服务器被称为broker
Topic

每条发布到Kafka集群的消息都有一个类别，这个类别被称为Topic。（物理上不同Topic的消息分开存储，逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处）
Partition

Partition是物理上的概念，每个Topic包含一个或多个Partition.
Producer

负责发布消息到Kafka broker
Consumer

消息消费者，向Kafka broker读取消息的客户端。
Consumer Group

每个Consumer属于一个特定的Consumer Group（可为每个Consumer指定group name，若不指定group name则属于默认的group）。

二、Kafka下载及安装

1、下载

wget http://apache.fayea.com/kafka/0.9.0.1/kafka_2.11-0.9.0.1.tgz

　　2、安装

tar zxvf kafka_2.11-0.9.0.1.tgz

cd kafka_2.11-0.9.0.1

　　3、集群配置

设定有两台服务器192.168.1.237、192.168.1.238，两台服务器各安装有两zookeeper,端口都为2181（zookeeper不再说明），每个服务器都为Kafka配置3个broker。

3.1、server.properties配置

broker.id = 10

port = 9090

host.name=192.168.1.237

advertised.host.name=192.168.1.237

log.dirs=/tmp/kafka-logs/server0

zookeeper.connect=192.168.1.237:2181,192.168.1.238:2181

　　说明：host.name\advertised.host.name两个参数还是要配置为IP，否则会有各种各样的问题。

3.2、server1.properties配置

cp config/servier.properties config/server1.properties
vim config/server1.properties

broker.id = 11

port = 9091

host.name=192.168.1.237

advertised.host.name=192.168.1.237

log.dirs=/tmp/kafka-logs/server1

zookeeper.connect=192.168.1.237:2181,192.168.1.238:2181

　　 3.3、server2.properties配置

cp config/servier.properties config/server2.properties

vim config/server2.properties

broker.id = 12

port = 9092

host.name=192.168.1.237

advertised.host.name=192.168.1.237

log.dirs=/tmp/kafka-logs/server2

zookeeper.connect=192.168.1.237:2181,192.168.1.238:2181

　　说明：同一台服务器port、log.dirs不能相同，不同的服务器broker.id只要在一个集群中都不能相同。

3.4、同理另一台服务器的server.properties，server1.properties，server2.properties的broker.id分别为：20、21、22，port分别为：9090、9091、9092 其它：host.name=192.168.1.238、advertised.host.name=192.168.1.238

3.5、启动

bin/kafka-server-start.sh config/server.properties &

bin/kafka-server-start.sh config/server1.properties &

bin/kafka-server-start.sh config/server2.properties &

　　3.6、监控端口

netstat -tunpl |grep 2181

netstat -tunpl |grep 9090

netstat -tunpl |grep 9091

netstat -tunpl |grep 9092

　　看一下这4个端口起来没有，并看一下iptables有没有加入这4个IP的启动，或要把iptables相关，否则JAVA连接不进来。

四、测试

4.1、创建Topic

bin/kafka-topics.sh --create --zookeeper 192.168.1.237:2181 --replication-factor 3 --partitions 1 --topic testTopic

　　 4.2、查看创建情况

bin/kafka-topics.sh --describe --zookeeper 192.168.1.237:2181 --topic testTopic

　　 4.3、生产者发送消息

bin/kafka-console-producer.sh --broker-list 192.168.1.237:9090 --topic testTopic

4.4、消费都接收消息

bin/kafka-console-consumer.sh --zookeeper 192.168.1.237:2181 --from-beginning --topic testTopic

　　 4.5、检查consumer offset位置

bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zkconnect 192.168.1.237:2181 --group testTopic

　　五、遇到的问题

1、运行一段时间报错

#

# There is insufficient memory for the Java Runtime Environment to continue.

# Native memory allocation (malloc) failed to allocate 986513408 bytes for committing reserved memory.

# An error report file with more information is saved as:

# //hs_err_pid6500.log

OpenJDK 64-Bit Server VM warning: INFO: os::commit_memory(0x00000000bad30000, 986513408, 0) failed; error='Cannot allocate memory' (errno=12)

　　解决：

　　　　you can adjust the JVM heap size by editing kafka-server-start.sh, zookeeper-server-start.shand so on:

export KAFKA_HEAP_OPTS="-Xmx1G -Xms1G"

　　 The -Xms parameter specifies the minimum heap size. To get your server to at least start up, try changing it to use less memory. Given that you only have 512M, you should change the maximum heap size (-Xmx) too:

export KAFKA_HEAP_OPTS="-Xmx256M -Xms128M"

I'm not sure what the minimal memory requirements of kafka in default config are - maybe you need to adjust the message size in kafka to get it to run.

高吞吐量的分布式发布订阅消息系统Kafka--安装及测试的更多相关文章

高吞吐量的分布式发布订阅消息系统Kafka之Producer源码分析
引言 Kafka是一款很棒的消息系统,今天我们就来深入了解一下它的实现细节,首先关注Producer这一方. 要使用kafka首先要实例化一个KafkaProducer,需要有brokerIP.序列化 ...
kafka 基础知识梳理-kafka是一种高吞吐量的分布式发布订阅消息系统
一.kafka 简介今社会各种应用系统诸如商业.社交.搜索.浏览等像信息工厂一样不断的生产出各种信息,在大数据时代,我们面临如下几个挑战: 如何收集这些巨大的信息如何分析它如何及时做到如上两点 ...
Kafka — 高吞吐量的分布式发布订阅消息系统【转】
1.Kafka独特设计在什么地方?2.Kafka如何搭建及创建topic.发送消息.消费消息?3.如何书写Kafka程序?4.数据传输的事务定义有哪三种?5.Kafka判断一个节点是否活着有哪两个条件 ...
一脸懵逼学习KafKa集群的安装搭建--（一种高吞吐量的分布式发布订阅消息系统）
kafka的前言知识: :Kafka是什么? 在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算.kafka是一个生产-消费模型. Producer:生产者,只负责数 ...
高吞吐量的分布式发布订阅消息系统Kafka--spring-integration-kafka的应用
一.概述 Spring Integration Kafka 是基于 Apache Kafka 和Spring Integration来集成Kafka,对开发配置提供了方便. 二.配置 1.spring ...
高吞吐量的分布式发布订阅消息系统Kafka-- 管理工具 Kafka Manager
一.概述 Kafka在雅虎内部被很多团队使用,媒体团队用它做实时分析流水线,可以处理高达20Gbps(压缩数据)的峰值带宽. 为了简化开发者和服务工程师维护Kafka集群的工作,构建了一个叫做Kafk ...
分布式发布订阅消息系统Kafka
高吞吐量的分布式发布订阅消息系统Kafka--安装及测试一.Kafka概述 Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据. 这种动作(网页浏览, ...
Kafka logo分布式发布订阅消息系统 Kafka
分布式发布订阅消息系统 Kafka kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳 ...
分布式发布订阅消息系统 Kafka 架构设计[转]
分布式发布订阅消息系统 Kafka 架构设计转自:http://www.oschina.net/translate/kafka-design 我们为什么要搭建该系统 Kafka是一个消息系统,原本开 ...

随机推荐

Winpcap构建用户级网桥
Winpcap构建网桥根据winpcap sdk中的user-level-bridge用户级网桥 |机器1 | |机器2 | | ...
PHP部分字符串函数汇总
PHP部分字符串函数汇总提交我的评论加载中已评论 PHP部分字符串函数汇总 2015-03-10 PHP100中文网 PHP100中文网 PHP100中文网微信号功能介绍互联网开发者社区 ...
C语言中scanf()的用法！
好文章转自:http://blog.tianya.cn/blogger/post_show.asp?BlogID=287129&PostID=3668453 scanf详解 scanf 原型: ...
golang 值得注意的地方（2则）
golang 的语法和使用方式都非常简单明了,没有花哨的语法糖,也没有多余的关键字. 但是即使是这么简洁的语言,仍然有一些不那么直白,需要注意的地方,比如下面2点. interface 赋值 nil ...
.NET Socket TCP 50W在线连接交互测试
在平常的交流中经常有人问.net socket能支持多少在线?和C++或linux下比起来应该差很远吧?其实产生这样问题的主要原因是.net很少人去做这方面的测试,而在linux下则经常听到什么100 ...
（转）对.net系统架构改造的一点经验和教训
在互联网行业,基于Unix/Linux的网站系统架构毫无疑问是当今主流的架构解决方案,这不仅仅是因为Linux本身足够的开放性,更因为围绕传统Unix/Linux社区有大量的成熟开源解决方案,覆盖了网 ...
Dynamic CRM 2013学习笔记（三十四）自定义审批流5 - 自动邮件通知
审批过程中,经常要求自动发邮件:审批中要通知下一个审批人进行审批:审批完通知申请人已审批完:被拒绝后,要通知已批准的人和申请人.下面详细介绍如何实现一个自动发邮件的插件: 1. 根据审批状态来确定 ...
[OpenCV] 4、图像叠加 addWeighted
>_<" 这次主要是图像叠加的基本操作: >_<" cv::addWeighted(imageROI, 1.0, logo, 0.6, 0, imageRO ...
Linux：Shell 常用通配符
字符含义 * 匹配 0 或多个字符 ? 匹配任意一个字符 [list] 匹配 list 中的任意单一字符 [!list] 匹配除list 中的任意单一字符以外的字符 [c1-c2] 匹配 c1-c ...
LINQ-to-SQL那点事~利用反射在LINQ-to-SQL环境中实现Ado.net的CURD操作
回到目录对于linq to sql提供的CURD操作,给我们的感觉就是简单,容易使用,更加面向对象,不用拼SQL语句了,这些好处都表示在处理单条实体或者集合长度小的情况下,如果有一个1000条的集合 ...

高吞吐量的分布式发布订阅消息系统Kafka--安装及测试

高吞吐量的分布式发布订阅消息系统Kafka--安装及测试的更多相关文章

随机推荐

热门专题