1.2 用例

  以下是一些Kafka 常见的用例。关于功能方面的一些概念,可以看这篇博客:http://engineering.linkedin.com/distributed-systems/log-what-every-software-engineer-should-know-about-real-time-datas-unifying。

  消息

  Kafka 可以很好的替代传统的消息代理。消息代理的使用有很多原因。(将数据发布解耦,缓存未处理消息等等)。相比于大多数消息系统,Kafka 有更大的吞吐量,内置分区,备份容错,这些特点使它可以很好处理大量消息请求。

  在应用体验中,我们会经常遇到相对不高的吞吐量需求,但需要很低的端到端延迟并且需要依赖Kafka持久化的情况。

  在这个领域中,Kafka相当于传统的消息系统,比如ActiveMQ 或 RabbitMQ

  网站活动跟踪

  Kafka 最早是提供一套实时发布订阅被用来重绘用户活动跟踪线路。网站的活动(页面展示,搜索,用户其他可能的活动)根据活动类型被转发给对应主题。为包括实时处理、实时监控和为离线处理和报表装载Hadoop或离线数据仓库的用例提供有效的支持。

  活动跟踪是每个用户页面的活动信息聚集合成的。

  评审

  Kafka经常被用于运行监控数据。这涉及从分布式应用到生产数据的汇总统计过程中的运行数据的支持。

  日志聚集

  Kafka经常被用来作为日志聚集的替代解决方案。日志聚集通常收集服务器上的日志文件放到一个集中的位置(一种文件系统比如HDFS)处理。 Kafka提取日志文件中的明细并返回清洗过的日志概要或流形式的事件数据信息。这样就可以提高处理速度同时对多数据源和分布式消费的支持更容易。相比集中式日志系统,如Scribe 或 Flume,Kafka 提供了相对更好的性能,较低的端到端延迟以及通过多备份保证了更健壮的持久化。

  流处理

  很多用户喜欢分阶段处理数据从原始数据主题中被消费经过汇总,加工或其他转化方式进一步消费到新主题的过程。例如一个文章推荐的处理流程会从RSS订阅抓取文章内容并发布给一个文章主题;然后经过有助于格式化或去重的处理后加入到一个文章清理的主题;最后阶段推送给匹配的用户。通过这些可以组成一个来至于各个主题的实时数据流程图。 这类转换框架中比较常见的有Storm 和 Samza。

  事件持久化

  事件持久化是一种将状态变化按时间顺序序列化记录存储的应用设计方式。Kafka 对巨大数据存储的支持可以支撑起建立在事件持久化方式上的优秀应用后端。

  提交日志

  Kafka 可以作为分布式系统的外部日志提交服务。日志可以用来进行多节点间数据备份和重新同步以恢复失败节点的数据。这种场景下 Kafka 支持日志压缩。在这种场景下Kafka 和Apache BookKeeper项目类似。

Kafka 文档用例的更多相关文章

  1. Kafka 文档引言

    原文地址:https://kafka.apache.org/documentation.html#semantics 1.开始 1.1 引言 Kafka是一个分布式,分区队列,冗余备份的消息存储服务. ...

  2. MicroPython最全资料集锦丨TPYBoard全系列教程之文档+例程源码

    MicroPython成功将Python引入到嵌入式领域,近几年MicroPython的发展和普及也证明,Python无疑将在未来几年内快速抢占和蚕食C/C++的份额.包括现在比较火爆的机器人.无人机 ...

  3. 以黄门镇黄湾村某一扶贫文档为例——将Excel数据填入到已存在的Word模板

    傻瓜可以写出机器读得懂代码,但写出让人能读懂的代码的是优秀程序员 作用:通过Excel文件中的一列数据作为文件名创建Word文档,并将Excel中的一行数据填一表,实现自动化 Excel的VBA宏代码 ...

  4. 如何为Dash/Zeal生成c++ 文档: 以abseil文档为例

    目录 1. 软件安装 2 Sample源文件下载: 3. 生成步骤 3.1 使用doxygen生成html文件 3.2 使用docsetutil 生成 dash/Zeal 格式 1. 软件安装: 1. ...

  5. kafka文档(转)

    来自:http://www.inter12.org/archives/842 一 BROKER 的全局配置 最为核心的三个配置 broker.id.log.dir.zookeeper.connect ...

  6. pytest文档16-用例a失败,跳过测试用例b和c并标记失败xfail

    前言 当用例a失败的时候,如果用例b和用例c都是依赖于第一个用例的结果,那可以直接跳过用例b和c的测试,直接给他标记失败xfail 用到的场景,登录是第一个用例,登录之后的操作b是第二个用例,登录之后 ...

  7. pytest文档2-用例运行规则

    用例设计原则 文件名以test_*.py文件和*_test.py 以test_开头的函数 以Test开头的类 以test_开头的方法 所有的包pakege必须要有__init__.py文件 help帮 ...

  8. unittest,selenium——批量,多线程执行多文档用例

    之前做过批量执行多.py文件,为了省时也做过单py文件多线程,现在做多py文件用例多线程 # coding:utf-8import unittestimport osimport timeimport ...

  9. pytest文档2-用例执行

    用例设计原则 1.文件名以test_******.py文件和*******_test.py 2.以test_****开头的函数 3.以Test***开头的类 4.以test_*****开头的方法 5. ...

随机推荐

  1. ASP.NET Core 之 Identity 入门(一)

    前言 在 ASP.NET Core 中,仍然沿用了 ASP.NET里面的 Identity 组件库,负责对用户的身份进行认证,总体来说的话,没有MVC 5 里面那么复杂,因为在MVC 5里面引入了OW ...

  2. 细说前端自动化打包工具--webpack

    背景 记得2004年的时候,互联网开发就是做网页,那时也没有前端和后端的区分,有时一个网站就是一些纯静态的html,通过链接组织在一起.用过Dreamweaver的都知道,做网页就像用word编辑文档 ...

  3. 3.Windows Server 2012 R2数据库部署

    很多人竟然不会安装数据库....好吧,来个图文教程,其实和windows里面一样安装,和安装2008一样的 先安装3.5:http://www.cnblogs.com/dunitian/p/53487 ...

  4. Mysql存储引擎比较

    Mysql作为一个开源的免费数据库,在平时项目当中会经常使用到,而在项目当中我们的着重点一般在设计使用数据库上而非mysql本身上,所以在提到mysql的存储引擎时,一般都不曾知道,这里经过网上相关文 ...

  5. Asp.net Core准备工作

    1.安装环境 安装.Net Core SDK 安装VS2015 Update3 安装DotNetCore.1.0.1-VS2015Tools.Preview2.0.2.exe 2.新建Core工程 项 ...

  6. C++ 11 多线程--线程管理

    说到多线程编程,那么就不得不提并行和并发,多线程是实现并发(并行)的一种手段.并行是指两个或多个独立的操作同时进行.注意这里是同时进行,区别于并发,在一个时间段内执行多个操作.在单核时代,多个线程是并 ...

  7. [LintCode]——目录

    Yet Another Source Code for LintCode Current Status : 232AC / 289ALL in Language C++, Up to date (20 ...

  8. oracle 误删数据恢复

    1.根据时间点查系统版本号scn: select timestamp_to_scn(to_timestamp('2013-01-07 11:20:00','YYYY-MM-DD HH:MI:SS')) ...

  9. BZOJ1012: [JSOI2008]最大数maxnumber [线段树 | 单调栈+二分]

    1012: [JSOI2008]最大数maxnumber Time Limit: 3 Sec  Memory Limit: 162 MBSubmit: 8748  Solved: 3835[Submi ...

  10. 开源发布:VS代码段快捷方式及可视化调试快速部署工具

    前言: 很久前,我发过两篇文章,分别介绍自定义代码版和可视化调试: 1:Visual Studio 小技巧:自定义代码片断 2:自定义可视化调试工具(Microsoft.VisualStudio.De ...