一、Kafka概述

  1.Kafka是一个分布式流媒体平台,它有三个关键功能:

   (1)发布和订阅记录流,类似于消息队列或企业消息传递系统;

   (2)以容错的持久方式存储记录流;

   (3)记录发送时处理流。

  2.Kafka通常应用的两大类应用

   (1)构建在系统或应用程序之间的可靠获取数据的实时流数据管道;

   (2)构建转换或响应数据流的实施流应用程序。

  3.Kafka中的角色

   发送消息:Producer

   接收消息:Consumer

   后台系统向kafka集群发送消息,然后kafka集群向用户分发消息

  4.为什么要用消息队列

   (1)解耦:可以自由处理和设置接收及发送端的配置,

  是一个接口的约束,可以避免出现一些问题

   (2)拓展性:可以增加处理过程

   (3)灵活:面对访问量增长到峰值时,不会因为超负荷请求而完全瘫痪

   (4)可恢复:一部分组件失效了,不会影响整个系统,并可以恢复

   (5)缓存:控制数据量经过系统的速度

   (6)顺序保证:保证消息数据按照有序处理

   (7)异步通信:

  提供了异步处理的机制,允许用户把消息当到队列中但不立即处理

  5.Kafka架构设计

    kafka依赖于zookeeper,用zk保存元数据信息(保存kafka集群节点状态信息和消费者当前消费信息)。所以要先搭建zookeeper集群,在搭建kafka集群。

    在kafka中,用来处理和存储生产者生成的消息的是broker,broker将生产者生成的消息以topic分类到不同分区partition,然后根据消费者订阅的主题对消费者发送消息。

二、Kafka的安装部署

  1.在下载安装包,本人使用的是2.11-2.0.0,上次到linux,解压

  2.在kafka路径下创建其日志文件夹

    mkdir logs

  3.进入config目录,进入server.properties文件修改配置信息

    broker.id=0
     delete.topic.enable=true
     log.dirs=/root/hd/kafka/logs
     zokeeper.connect=hd1-1:2181,hd1-2:2181,hd1-3:2181

  保存并退出;

  4.将修改好的kafka文件夹发送到其他集群机器,并修改server.properties中的broker.id为1,2,3...

    scp -r  /root/hd/kafka  hd09-01:/root/hd/

  5.启动zookeeper集群,再启动kafka集群

    进入kafka目录下输入命令:

    bin/kafka-server-start.sh config/server/properties

  启动完成!!

  

Kafka概述及安装部署的更多相关文章

  1. Kafka集群安装部署、Kafka生产者、Kafka消费者

    Storm上游数据源之Kakfa 目标: 理解Storm消费的数据来源.理解JMS规范.理解Kafka核心组件.掌握Kakfa生产者API.掌握Kafka消费者API.对流式计算的生态环境有深入的了解 ...

  2. HBase的概述和安装部署

    一.HBase概述 1.HBase是Hadoop数据库,是一个分布式.可扩展的大数据存储. HBase是用于对大数据进行随机.实时读写访问的非关系型数据库,它的目标托管非常大的表——数十亿行N百万列. ...

  3. Zookeeper的概述、安装部署及选举机制

    一.Zookeeper概述 1.Zookeeper是Hadoop生态的管理者,它致力于开发和维护开源服务器,实现高度可靠的分布式协调. 2.Zookeeper的两大功能: (1)存储数据 (2)监听 ...

  4. Flume的概述和安装部署

    一.Flume概述 Flume是一种分布式.可靠且可用的服务,用于有效的收集.聚合和移动大量日志文件数据.Flume具有基于流数据流的简单灵活的框架,具有可靠的可靠性机制和许多故障转移和恢复机制,具有 ...

  5. Spark-Unit1-spark概述与安装部署

    一.Spark概述 spark官网:spark.apache.org Spark是用的大规模数据处理的统一计算引擎,它是为大数据处理而设计的快速通用的计算引擎.spark诞生于加油大学伯克利分校AMP ...

  6. Kafka介绍及安装部署

    本节内容: 消息中间件 消息中间件特点 消息中间件的传递模型 Kafka介绍 安装部署Kafka集群 安装Yahoo kafka manager kafka-manager添加kafka cluste ...

  7. Kafka 集群安装部署

    2.1 安装部署 2.1.1 集群规划 192.168.1.102 192.168.1.103 192.168.1.104 zookeeper zookeeper zookeeper kafka ka ...

  8. kafka集群安装部署

    kafka集群安装 使用的版本 系统:centos6.5 centos6.7 jdk:1.7.0_79 zookeeper:3.4.9 kafka:2.10-0.10.1.0 一.环境准备[只列,不具 ...

  9. centos7下kafka集群安装部署

    应用摘要: Apache kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.Kafka是一种高吞吐量的 分布式发布订阅消息系统,是消息中间件的一种,用于构建实时 ...

随机推荐

  1. python numpy中数组.min()

    import numpy as np a = np.array([[1,5,3],[4,2,6]]) print(a.min()) #无参,所有中的最小值 print(a.min(0)) # axis ...

  2. 关于STM32 __IO 的变量定义

    这个_IO 是指静态 这个 _IO 是指静态 volatile uint32_t 是指32位的无符号整形变量uint32_t 是指32位的无符号整形变量: 搞stm32这么久了,经常看到stm32里面 ...

  3. js基础学习

  4. ORACLE的数据类型的长度合集

    --  ORACLE的数据类型常用的数据库字段类型如下:字段类型 中文说明 限制条件 其它说明CHAR 固定长度字符串 最大长度2000 bytesVARCHAR2 可变长度的字符串 最大长度4000 ...

  5. Confluence 6 其他需要备份和恢复的地方

    XML 备份被描述用于在 Confluence 备份使用的其他方法,例如升级和移动服务器.使用上面描述的备份和恢复方法也适用这些地方. 我们的 upgrade guide 不要求使用一个 XML 备份 ...

  6. nginx实践(二)之静态资源web服务(浏览器缓存场景)

    配置语法-expires

  7. SpringData分页功能

    在SpringData中实现分页功能我们需要将接口实现PagingAndSortingRepository这个接口提供了分页查询的方法 Page<T> findAll(Pageable p ...

  8. 3790:最短路径问题(HDU)

    Problem Description 给你n个点,m条无向边,每条边都有长度d和花费p,给你起点s终点t,要求输出起点到终点的最短距离及其花费,如果最短距离有多条路线,则输出花费最少的.   Inp ...

  9. 【python】ftp连接,主被动,调试等级

    示例代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- import os from ftplib import FTP def ftp_down( ...

  10. laravel 里面结合关联查询 的when()用法

    Laravel 5.6 里面的when用法: $name = $request->get('name'); //活动标题 $start_time = $request->get('star ...