Apache Storm 1.1.0 中文文档 | ApacheCN
前言
Apache Storm 是一个免费的,开源的,分布式的实时计算系统.
官方文档: http://storm.apache.org
中文文档: http://storm.apachecn.org
ApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度 为 96%.
感谢大家参与到该活动中来
感谢无私奉献的 贡献者,才有了这份 Storm 1.1.0 中文文档
感谢一路有你的陪伴,我们才可以做的更好,走的更快,走的更远,我们一直在努力 。。。
网页地址: http://storm.apachecn.org/releases/cn/1.1.0/
github: https://github.com/apachecn/storm-doc-zh
如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081
技术交流企鹅群: 214293307
学习方法
Storm 怎么学习,怎么入门 ?
我只能悄悄的告诉你,跟着中文文档走,把文档看一遍先,文档中的概念,例子什么的先弄懂,基本上就入门了
Storm 如何成为大神呢?
先看看大佬们的 blog 学习下,多在群里面跟别人讨论下
文档内容目录
NOTE(注意)
在最新版本中, class packages 已经从 "backtype.storm" 改变成 "org.apache.storm" 了, 所以使用旧版本编译的 topology 代码不会像在 Storm 1.0.0 上那样运行了. 通过以下配置提供向后的兼容性
client.jartransformer.class: "org.apache.storm.hack.StormShadeTransformer"
如果要运行使用较旧版本 Storm 编译的代码, 则需要在 Storm 安装中添加上述配置. 该配置应该添加到您用于提交 topologies(拓扑)的机器中.
Storm 基础
- Javadoc
- 概念
- 调度器
- 配置
- 保证消息处理
- Daemon(守护进程)容错
- 命令行 client(客户端)
- REST API
- 理解 Storm topology 的 parallelism(并行度)
- FAQ
Layers on Top of Storm
Storm Trident
Trident 是 Storm 的另一个 interface(接口).
它提供了 exactly-once(仅且一次)处理, "transactional(事务性的)" datastore persistence(数据存储持久化), 以及一些常见的 stream analytics operations(流式分析操作).
- Trident 教程 -- 基础的概念和预排工作
- Trident API 概述 -- 针对 transforming(转换)和 orchestrating 数据的操作
- Trident State(状态) -- exactly-once(仅且一次)处理以及 fast(快速的), persistent aggregation(持久化的聚合)
- Trident spouts -- transactional(事务性的)和 non-transactional(非事务性的)数据引入
- Trident RAS API -- 与 Trident 一起使用 Resource Aware Scheduler .
Storm SQL
该 Storm SQL 的集成可以让用户在 Storm 的 streaming data(流式数据)上来运行 SQL 查询.
NOTE(注意): Storm SQL 是一个 experimental(实验性的)
功能, 所以 Storm SQL 的结构和所支持的功能在以后可能会发生变化.
但是小的变化不会影响用户体验. 在引入 UX 更改时, 我们会及时通知用户.
Flux
Storm 安装和部署
- 安装一个 Storm 集群
- Local mode(本地模式)
- 问题排查
- 在生产 cluster(集群)上运行 topologies(拓扑)
- 构建 Storm with Maven
- 安装 Secure(安全的)Cluster(集群)
- CGroup 的实施
- Pacemaker 针对大集群减低在 zookeeper 上的负载
- Resource Aware Scheduler(资源意识调度器)
- Daemon Metrics/Monitoring(守护进程的度量/监控)
- Windows 平台的用户指南
Storm 中级
- Serialization(序列化)
- Common patterns(常见模式)
- Clojure DSL
- 与 Storm 一起使用非 JVM 的语言
- 分布式的 RPC
- Transactional topologies(事务性的拓扑)
- Hooks(钩子)
- Metrics(度量)
- State Checkpointing
- Windowing(窗口操作)
- Joining Streams
- Blobstore(Distcahce)
Storm 调试
Storm 与外部系统, 以及其它库的集成
- Apache Kafka 集成, 新的 Kafka Consumer(消费者)集成
- Apache HBase 集成
- Apache HDFS 集成
- Apache Hive 集成
- Apache Solr 集成
- Apache Cassandra 集成
- JDBC 集成
- JMS 集成
- Redis 集成
- Event Hubs 集成
- Elasticsearch 集成
- MQTT 集成
- Mongodb 集成
- OpenTSDB 集成
- Kinesis 集成
- Druid 集成
- Kestrel 集成
Container, Resource Management System Integration
Storm 高级
- 为 Storm 定义非 JVM 语言的 DSL
- 多语言协议(如何为其它语言提供支持)
- 实现文档
结束感言
翻译过程中,大家有说有笑,有时候大家自己也不太懂,关键字啥的都会搞错,完全看不懂,一脸懵逼,醉了 。。。
但总算是把这份中文文档给弄好了吧,也算是对大家,或者对自己有一个交代,没有半途而废吧!~~~
希望大家可以一起走的更快,走的更远 。。。
如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081
技术交流企鹅群: 214293307
Apache Storm 1.1.0 中文文档 | ApacheCN的更多相关文章
- Apache Spark 2.2.0 中文文档
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN Geekhoo 关注 2017.09.20 13:55* 字数 2062 阅读 13评论 0喜欢 1 快速入门 使用 ...
- Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎 ...
- Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点: SparkSession ...
- Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
SparkR (R on Spark) 概述 SparkDataFrame 启动: SparkSession 从 RStudio 来启动 创建 SparkDataFrames 从本地的 data fr ...
- Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN
Structured Streaming 编程指南 概述 快速示例 Programming Model (编程模型) 基本概念 处理 Event-time 和延迟数据 容错语义 API 使用 Data ...
- Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点: SparkSession ...
- Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
Spark RDD(Resilient Distributed Datasets)论文 概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD ...
- Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合 外部 Datasets(数据集) RDD 操作 基础 传递 Functio ...
- Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingContext Discretized Streams (DStreams)(离散化流) Inp ...
随机推荐
- MFC常见问题以及解决方法(1)_MFC下文本编辑框按下回车后窗口退出
这里主要介绍遇到这种方法的解决方案,解决方法可能有多种,但这里只给出有效的一种,这里不会详细说明出现问题的原因以及为什么这样解决,想了解更多可以百度,写这个主要是防止以后忘记,做个简单的笔记. 问题: ...
- (转)每天一个linux命令(50):crontab命令
场景:在学习Linux环境下自动部署项目时候,可以通过crontab命令设定定时任务,实现服务端项目的自动部署! 前一天学习了 at 命令是针对仅运行一次的任务,循环运行的例行性计划任务,linux系 ...
- 初学安卓开发随笔之 Intent 用法
首先,对于安卓开发,目前世界上流行的是使用的是Android studio 2.0 .(hh 学着来呗 书上说用这个,,) 今后就定一个计划 每天更新一个Android 随笔,增强一下自控力吧!!! ...
- Java第四次上课博文动手动脑
Java第四次上课博文动手动脑 1. 查看String.equals()方法 public class StringEquals { /** * @param args the command ...
- 说一说Jquery中的empty()与remove()的区别和用法
今天在改一个新人写的代码,好吧,我承认改代码比自己写代码要来的痛苦. 主要是在测试一个table.table中有一列是删除操作.我的删除功能是 这样的,当点击删除的时候,判断这个table中的tr行是 ...
- pwnable.kr col之write up
Daddy told me about cool MD5 hash collision today. I wanna do something like that too! ssh col@pwnab ...
- Linux学习-->linux系统在移动硬盘的安装
由于自己看了一些文章和linux的好奇,想来一窥Linux的奥秘,因此自己准备学习使用Linux系统,这里记录下自己的安装过程,方便以后自己重装系统时进行查阅. 参考的书籍是鸟哥的<Linux私 ...
- 华为软件开发云对比Jenkins-JavaWeb项目持续部署方式
一.前言:Jenkins介绍 Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件的持续集成和持续部署变成可能. 本文 ...
- TransactionTemplate编程式事务管理方式的进阶使用---自定义拓展模板类
1, 前面一篇的文章介绍了TransactionTemplate的基本使用方法. 同事在其基础上又做了一层封装,这样更贴合本公司的业务与规范. 2, 首先定义了两个接口: ServiceTemplat ...
- Spring-mybatis没有了XXXmapper.java和Dao的实现类还有Service的实现类
对于刚学过框架的同学可能知道,mybatis有两种主要的配置文件: SqlMapConfig.xml(mybatis全局配置文件,名称不固定,用来配置运行环境(数据源.事务) XXXmapper.xm ...