Distributed processing
Distributed processing
|
Tool |
好处 |
坏处 |
类型 |
支持序列化 |
支持根据负载动态调度任务 |
支持c |
支持dependency的调度 |
有成熟的library |
|||||
|
Actor model |
天生支持分布式,本身已经包含基本的serialization功能 |
比较底层 需要自己编写调度代码 没有广泛支持c的library |
传统基于msg的系统 |
v |
x |
v |
x |
x |
|||||
|
Apache Storm |
本身支持分布式,dependency的调度 |
基于java,不支持c |
Streaming 系统 |
v |
v |
x |
v |
v |
|||||
|
Grpc |
支持c |
需要自己编写调度代码 效率不高(基于http) |
RPC |
v |
x |
v |
x |
v |
|||||
|
Stapl (Standard Adaptive Parallel Library) https://parasol.tamu.edu/stapl/ |
STAPL(标准模板自适应并行库)是用于在C ++中开发并行程序的框架。它设计用于共享和分布式内存并行计算机 TaskGraph |
V? |
|||||||||||
|
Stolos, https://github.com/sailthru/stolos/blob/master/README.md Chronos, luigi, Azkaban |
a task dependency scheduler that helps build distributed pipelines |
像是接近批处理框架,实时性可能会慢? |
V? |
||||||||||
|
Zeromq |
支持c |
只是消息队列,需要自己编写序列化,和调度 |
V? |
||||||||||
|
Celery http://www.celeryproject.org/ |
芹菜:分布式任务队列 Celery是基于分布式消息传递的异步任务队列/作业队列。它专注于实时操作,但也支持调度。 |
基于python |
V? |
x |
? |
v |
|||||||
|
Thrift |
|||||||||||||
|
hadoop |
批处理系统,慢 Map reduce不是非常适用 Java |
MapReduce-like 系统 |
v |
v |
v |
x |
V |
||||||
|
MPI (mpich2 和 openmpi) |
传统基于msg的系统 |
||||||||||||
|
GraphLab (dato) https://turi.com/ |
好像用于机器学习方面的 |
图计算系统 |
|||||||||||
|
Giraph / Hama |
图计算系统 |
||||||||||||
|
Spark Streaming |
不是纯粹的流处理,实时性可能会有影响 |
Streaming 系统 |
|||||||||||
|
Flink |
Streaming 系统 |
||||||||||||
|
|
|||||||||||||
|
Bonic https://boinc.berkeley.edu/trac/wiki/ProjectMain |
|||||||||||||
|
Tpl dataflow |
|||||||||||||
|
Julia language https://julialang.org/ |
语言层面支持分布式 |
没有图调度 |
v |
v |
vx |
x |
V |
||||||
|
是一个标准 |
|||||||||||||
|
是一个标准 |
|||||||||||||
|
|||||||||||||
|
Keywords
Distributed processing
Distributed computing
Distributed task scheduler
并行计算
高性能计算
Task Dependence Graph
技术
Paxos
Consistent Hash
分布式存储系统还有一系列的理论、算法、技术作为支撑:例如 Paxos, CAP, ConsistentHash, Timing (时钟), 2PC, 3PC
分布式计算系统也做了一个分类,如下:
1. 传统基于msg的系统
2. MapReduce-like 系统
3. 图计算系统
4. 基于状态(state)的系统
5. Streaming 系统
https://en.wikipedia.org/wiki/List_of_concurrent_and_parallel_programming_languages
http://www.infoq.com/cn/articles/comparison-of-main-stream-processing-framework
http://www.infoq.com/cn/articles/comparison-of-main-stream-processing-framework
Distributed processing的更多相关文章
- 分布式系统(Distributed System)资料
这个资料关于分布式系统资料,作者写的太好了.拿过来以备用 网址:https://github.com/ty4z2008/Qix/blob/master/ds.md 希望转载的朋友,你可以不用联系我.但 ...
- Stream processing with Apache Flink and Minio
转自:https://blog.minio.io/stream-processing-with-apache-flink-and-minio-10da85590787 Modern technolog ...
- Identifying a distributed denial of service (DDOS) attack within a network and defending against such an attack
The invention provides methods, apparatus and systems for detecting distributed denial of service (D ...
- Hadoop
Hadoop应用场景 Hadoop是专为离线处理和大规模数据分析而设计的,它并不适合那种对几个记录随机读写的在线事务处理模式. 大数据存储:Hadoop最适合一次写入.多次读取的数据存储需求,如数据仓 ...
- 【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
- 中国计算机学会CCF推荐国际学术会议
中国计算机学会推荐国际学术会议 (计算机系统与高性能计算) 一.A类 序号 会议简称 会议全称 出版社 网址 1 ASPLOS Architectural Support for Programmin ...
- Hadoop基础——第一弹:Hadoop介绍
一.基础 1.了解Java.Linux操作系统相关知识 2.如需精进,应为水平要达到一定标准,能够阅读国外相关技术网站,eg:http://hadoop.apache.org/ 二.什么是Hadoop ...
- Hadoop HDFS 用户指南
This document is a starting point for users working with Hadoop Distributed File System (HDFS) eithe ...
- Azure HDInsight 和 Spark 大数据实战(一)
What is HDInsight? Microsoft Azure HDInsight 是基于 Hortonoworks Data Platform (HDP) 的 Hadoop 集群,包括Stor ...
随机推荐
- 关于Java的特点之封装
抽象 1.简单理解 我们在前面去定义一个类时候,实际上就是把一类事物的共有的属性和行为提取出来,形成一个物理模型(模版).这种研究问题的方法称为抽象. 封装--什么是封装 封装就是把抽象出来的数据和对 ...
- spring源码研究1 如何导入源码
环境 jdk8 windows8 1.下载源码 https://github.com/spring-projects/spring-framework 2.编译为eclipse项目 源码下载无法直接导 ...
- 七、在U-boot中让LCD显示图片
1. 增加Nandflash读取代码 因为要显示图片,而图片明显是放在Nandflash中比较合适,因此需要有能够操作Nandflash的函数.在U-boot中已经有能操作Nandflash的函数了, ...
- session_id 生成原理
PHPSESSID生成 生成规则是根据hash_func散列来生成的,相关的参数有: - 客户端IP - 当前时间(秒) - 当前时间(微妙) - PHP自带的随机数生产器 hash_func是php ...
- 2019-03-06-day005-字典操作
情商 别人与你相处感觉很轻松. ?为人处世,有笑点. 照顾对方的情绪. 与别人相处可以很好地解决问题. 你身边总有那么一两个人,别人都喜欢与他交往,和他在一起,很舒服. 情商后天可以提升的. 1,你本 ...
- ipython output logging:使用日志记录输出
通常使用ipython的%logstart日志功能时,仅开启输入的记录. 例如在ipython中开启%logstart后,记录的日志文件内容如下: #!/usr/bin/env python # 20 ...
- Oracle查看表或者视图的定义语句
查看表的定义 SELECT DBMS_METADATA.GET_DDL('TABLE','TABLE_NAME') FROM DUAL; 查看视图的定义语句 SELECT DBMS_METADATA. ...
- 《vim实用技巧》读书笔记
1. . 命令 2. * 命令 3. cw 命令: (c:修改)会删除从光标位置到单词结尾间的字符,并进入插入模式. eg: cw.copy1 即: 删除从光标位置到单词结尾间的字符,并插入 ...
- 基于区域的OSPF简单认证
实验要求:掌握OSPF区域简单认证配置 拓扑如下: 配置如下: R1enable configure terminal interface s0/0/0ip address 192.168.1.1 2 ...
- lvm创建和快照
查看磁盘 创建分区 新建1G的1分区 新建1G的2分区 新建1G的3分区 查看新建的分区 因标准分区是83交换分区是82做lv是8e所以要改变类型 查看: 保存退出: 创建物理卷pv 将物理卷pv创建 ...