Kafka 文档用例
1.2 用例
以下是一些Kafka 常见的用例。关于功能方面的一些概念,可以看这篇博客:http://engineering.linkedin.com/distributed-systems/log-what-every-software-engineer-should-know-about-real-time-datas-unifying。
消息
Kafka 可以很好的替代传统的消息代理。消息代理的使用有很多原因。(将数据发布解耦,缓存未处理消息等等)。相比于大多数消息系统,Kafka 有更大的吞吐量,内置分区,备份容错,这些特点使它可以很好处理大量消息请求。
在应用体验中,我们会经常遇到相对不高的吞吐量需求,但需要很低的端到端延迟并且需要依赖Kafka持久化的情况。
在这个领域中,Kafka相当于传统的消息系统,比如ActiveMQ 或 RabbitMQ。
网站活动跟踪
Kafka 最早是提供一套实时发布订阅被用来重绘用户活动跟踪线路。网站的活动(页面展示,搜索,用户其他可能的活动)根据活动类型被转发给对应主题。为包括实时处理、实时监控和为离线处理和报表装载Hadoop或离线数据仓库的用例提供有效的支持。
活动跟踪是每个用户页面的活动信息聚集合成的。
评审
Kafka经常被用于运行监控数据。这涉及从分布式应用到生产数据的汇总统计过程中的运行数据的支持。
日志聚集
Kafka经常被用来作为日志聚集的替代解决方案。日志聚集通常收集服务器上的日志文件放到一个集中的位置(一种文件系统比如HDFS)处理。 Kafka提取日志文件中的明细并返回清洗过的日志概要或流形式的事件数据信息。这样就可以提高处理速度同时对多数据源和分布式消费的支持更容易。相比集中式日志系统,如Scribe 或 Flume,Kafka 提供了相对更好的性能,较低的端到端延迟以及通过多备份保证了更健壮的持久化。
流处理
很多用户喜欢分阶段处理数据从原始数据主题中被消费经过汇总,加工或其他转化方式进一步消费到新主题的过程。例如一个文章推荐的处理流程会从RSS订阅抓取文章内容并发布给一个文章主题;然后经过有助于格式化或去重的处理后加入到一个文章清理的主题;最后阶段推送给匹配的用户。通过这些可以组成一个来至于各个主题的实时数据流程图。 这类转换框架中比较常见的有Storm 和 Samza。
事件持久化
事件持久化是一种将状态变化按时间顺序序列化记录存储的应用设计方式。Kafka 对巨大数据存储的支持可以支撑起建立在事件持久化方式上的优秀应用后端。
提交日志
Kafka 可以作为分布式系统的外部日志提交服务。日志可以用来进行多节点间数据备份和重新同步以恢复失败节点的数据。这种场景下 Kafka 支持日志压缩。在这种场景下Kafka 和Apache BookKeeper项目类似。
Kafka 文档用例的更多相关文章
- Kafka 文档引言
原文地址:https://kafka.apache.org/documentation.html#semantics 1.开始 1.1 引言 Kafka是一个分布式,分区队列,冗余备份的消息存储服务. ...
- MicroPython最全资料集锦丨TPYBoard全系列教程之文档+例程源码
MicroPython成功将Python引入到嵌入式领域,近几年MicroPython的发展和普及也证明,Python无疑将在未来几年内快速抢占和蚕食C/C++的份额.包括现在比较火爆的机器人.无人机 ...
- 以黄门镇黄湾村某一扶贫文档为例——将Excel数据填入到已存在的Word模板
傻瓜可以写出机器读得懂代码,但写出让人能读懂的代码的是优秀程序员 作用:通过Excel文件中的一列数据作为文件名创建Word文档,并将Excel中的一行数据填一表,实现自动化 Excel的VBA宏代码 ...
- 如何为Dash/Zeal生成c++ 文档: 以abseil文档为例
目录 1. 软件安装 2 Sample源文件下载: 3. 生成步骤 3.1 使用doxygen生成html文件 3.2 使用docsetutil 生成 dash/Zeal 格式 1. 软件安装: 1. ...
- kafka文档(转)
来自:http://www.inter12.org/archives/842 一 BROKER 的全局配置 最为核心的三个配置 broker.id.log.dir.zookeeper.connect ...
- pytest文档16-用例a失败,跳过测试用例b和c并标记失败xfail
前言 当用例a失败的时候,如果用例b和用例c都是依赖于第一个用例的结果,那可以直接跳过用例b和c的测试,直接给他标记失败xfail 用到的场景,登录是第一个用例,登录之后的操作b是第二个用例,登录之后 ...
- pytest文档2-用例运行规则
用例设计原则 文件名以test_*.py文件和*_test.py 以test_开头的函数 以Test开头的类 以test_开头的方法 所有的包pakege必须要有__init__.py文件 help帮 ...
- unittest,selenium——批量,多线程执行多文档用例
之前做过批量执行多.py文件,为了省时也做过单py文件多线程,现在做多py文件用例多线程 # coding:utf-8import unittestimport osimport timeimport ...
- pytest文档2-用例执行
用例设计原则 1.文件名以test_******.py文件和*******_test.py 2.以test_****开头的函数 3.以Test***开头的类 4.以test_*****开头的方法 5. ...
随机推荐
- UE4新手之编程指南
虚幻引擎4为程序员提供了两套工具集,可共同使用来加速开发的工作流程. 新的游戏类.Slate和Canvas用户接口元素以及编辑器功能可以使用C++语言来编写,并且在使用Visual Studio 或 ...
- 笔记:Binder通信机制
TODO: 待修正 Binder简介 Binder是android系统中实现的一种高效的IPC机制,平常接触到的各种XxxManager,以及绑定Service时都在使用它进行跨进程操作. 它的实现基 ...
- 创建几个常用table展示方式插件
这次和大家分享的是自己写的一个table常用几种展示格式的js插件取名为(table-shenniu),样式使用的是bootstrap.min.css,还需要引用jquery.min.js包,这个插件 ...
- B样条基函数的定义和性质
定义:令U={u0,u1,…,um}是一个单调不减的实数序列,即ui≤ui+1,i=0,1,…,m-1.其中,ui称为节点,U称为节点矢量,用Ni,p(u)表示第i个p次(p+1阶)B样条基函数,其定 ...
- 数据图表插件Echarts(一)
一.引言 最近做一个智慧城市项目,项目中需要图表和报表进行数据分析,从网上找了很多,最后找到了百度开放的echarts,一个很强大的插件. 二.介绍 ECharts,缩写来自Enterprise Ch ...
- 玩转spring boot——开篇
很久没写博客了,而这一转眼就是7年.这段时间并不是我没学习东西,而是园友们的技术提高的非常快,这反而让我不知道该写些什么.我做程序已经有十几年之久了,可以说是彻彻底底的“程序老炮”,至于技术怎么样?我 ...
- 动手做第一个Chrome插件
Chrome插件是令人惊讶的简单,一旦你弄懂它的工作和实现原理.它是由一部分HTML,一部分Js,然后混合了一个叫做manifest.json的Json文件组合而成的整体.这意味着你可以使用你最擅长的 ...
- 【云知道】究极秒杀Loadrunner乱码
Loadrunner乱码一击必杀 之前有介绍一些简单的针对Loadrunner脚本或者调试输出内容中乱码的一些设置,但是并没能完全解决一些小伙伴的问题,因为那些设置实在能力有限,还是有很多做不到的事情 ...
- 那些年【深入.NET平台和C#编程】
一.深入.NET框架 1..NET框架具有两个组件:CLR(公共语言运行时)和FCL(框架类库),CLR是.NET框架的基础 2.框架核心类库: System.Collections.Generic: ...
- Create a Team in RHEL7
SOLUTION VERIFIED September 13 2016 KB2620131 Environment Red Hat Enterprise Linux 7 NetworkManager ...