flink 笔记 - 相关文章

【flink 笔记】的更多相关文章

01.Flink笔记-编译、部署

Flink开发环境部署配置 Flink是一个以Java及Scala作为开发语言的开源大数据项目,代码开源在github上,并使用maven来编译和构建项目.所需工具:Java.maven.Git. 本次操作是在windows环境下. 一.工具安装 Java配置(略) maven配置下载安装配置环境变量修改settings.xml设置更改本地仓库目录,默认是C:\用户\.m2\Respository,为了避免C盘空间不够,更改到其他盘目录 <localRepository>D:\Resp…

flink笔记(三) flink架构及运行方式

架构图 Job Managers, Task Managers, Clients JobManager(Master) 用于协调分布式执行.它们用来调度task,协调检查点,协调失败时恢复等. Flink运行时至少存在一个JobManager. 一个高可用的运行模式会存在多个JobManager,它们其中有一个是leader,而其他的都是standby. TaskManager(Worker) 用于执行一个dataflow的task(或者特殊的subtask).数据缓冲和data stream的…

Flink笔记(二) DataStream Operator(数据流操作)

DataStream Source 基于文件 readTextFile(path) 读取 text 文件的数据 readFile(fileInputFormat, path) 通过自定义的读取方式, 来读取文件的数据基于socket socketTextStream 从 socket 端口中读取数据基于集合 fromCollection(Collection) 从 collection集合中读取数据, 从而形成一个数据流, 集合中的元素类型需要一致 fromElements(T ...) 从…

Flink 笔记(一)

简介 Flink是一个低延迟.高吞吐.统一的大数据计算引擎, Flink的计算平台可以实现毫秒级的延迟情况下,每秒钟处理上亿次的消息或者事件. 同时Flink提供了一个Exactly-once的一致性语义, 保证了数据的正确性.(对比其他: At most once, At least once) 这样就使得Flink大数据引擎可以提供金融级的数据处理能力(安全). Flink作为主攻流计算的大数据引擎,它区别于Storm,Spark Streaming以及其他流式计算引擎的是: 它不仅是一个高…

【flink 笔记】的更多相关文章

01.Flink笔记-编译、部署

flink笔记(三) flink架构及运行方式

Flink笔记(二) DataStream Operator(数据流操作)

Flink 笔记(一)

Flink笔记

02.Flink的单机wordcount、集群安装

Apache Flink学习笔记

Flink学习笔记-新一代Flink计算引擎

Flink学习笔记：Flink Runtime

Flink学习笔记:Flink开发环境搭建