Redis、MPP、kafka 、MongDB简介】的更多相关文章

Redis Cluster搭建方法简介 (2013-05-29 17:08:57) 转载▼       Redis Cluster即Redis的分布式版本,将是Redis继支持Lua脚本之后的又一重磅功能,官方声明将会在今年第三季度发布Redis Cluster的beta版并在年底发布第一个稳定版本.当前,虽然Redis的稳定版本里还没有集成分布式功能,但实际上在开发版中Redis Cluster的开发已经取得了长足的进展,我们已经可以搭建Redis集群并使用其部分功能了.今天,本博主基于最新的…
kafka原理简介并且与RabbitMQ的选择 kafka原理简介,rabbitMQ介绍,大致说一下区别 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用.目前越来越多的开源分布式处理系统如Cloudera.Apache Storm.Spark都支持与Kafka集成. 消息的发布描述为producer,消息的订阅描述为consumer,将中间的存储阵列称作broker(代理).kafka是linkedin用于日志处理的分布式消息队…
本文不对三者之间的性能进行对比,只是从三者的特性上区分他们,并指出三者的不用应用场景. 1.publish/subscribe 发布订阅模式如下图所示可以具有多个生产者和发布者,redis.kafka.rebittMQ都满足这样的要求. 但是三者有各自的特色. 1.1 redis redis的特征就是快,由于其数据是存储在内存中的,处理速度相对另外两者快了不少.通过使用redis可以实现一个简单具有实时通信功能的聊天室. 2.2 kafka kafka的设计初衷是一个日志系统,其队列中的数据能够…
本文不对三者之间的性能进行对比,只是从三者的特性上区分他们,并指出三者的不用应用场景. 1.publish/subscribe 发布订阅模式如下图所示可以具有多个生产者和发布者,redis.kafka.rebittMQ都满足这样的要求. 但是三者有各自的特色. 1.1 redis redis的特征就是快,由于其数据是存储在内存中的,处理速度相对另外两者快了不少.通过使用redis可以实现一个简单具有实时通信功能的聊天室. 2.2 kafka kafka的设计初衷是一个日志系统,其队列中的数据能够…
我们知道过去对于Kafka的定义是分布式,分区化的,带备份机制的日志提交服务.也就是一个分布式的消息队列,这也是他最常见的用法.但是Kafka不止于此,打开最新的官网. 我们看到Kafka最新的定义是:Apache Kafka® is a distributed streaming platform 分布式流处理平台. 这里也清晰的描述了Kafka的特点:Kafka用于构建实时数据管道和流式应用程序.它具有水平可扩展性.容错性.速度极快,并在数千家公司投入生产. 所以现在的Kafka已经不仅是一…
Kafka在0.10.0.0版本以前的定位是分布式,分区化的,带备份机制的日志提交服务.而kafka在这之前也没有提供数据处理的顾服务.大家的流处理计算主要是还是依赖于Storm,Spark Streaming,Flink等流式处理框架. Storm,Spark Streaming,Flink流处理的三驾马车各有各的优势. Storm低延迟,并且在市场中占有一定的地位,目前很多公司仍在使用. Spark Streaming借助Spark的体系优势,活跃的社区,也占有一定的份额. 而Flink在设…
Kafka Connect简介 http://colobu.com/2016/02/24/kafka-connect/#more Kafka 0.9+增加了一个新的特性Kafka Connect,可以更方便的创建和管理数据流管道.它为Kafka和其它系统创建规模可扩展的.可信赖的流数据提供了一个简单的模型,通过connectors可以将大数据从其它系统导入到Kafka中,也可以从Kafka中导出到其它系统.Kafka Connect可以将完整的数据库注入到Kafka的Topic中,或者将服务器的…
Redis :间值数据库,适合缓存用户Session会话与经常需要查的数据1.Redis集群,为什么在项目中使用集群  1.持久化,持久化是最简单的高可用方法(有时甚至不被归为高可用的手段),主要左右是数据备份,即将数据存储在硬盘,保证数据不会因进程退出而丢失:2.复制:主从复制是高可用Redis的基础,哨兵和集群都是在复制基础上实现高可用的.复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复.缺陷:故障恢复无法自动化:写操作无法负载均衡:存储能力受到单机的限制.3.哨兵:在…
一.简介 1.1 概述 Kafka是最初由Linkedin公司开发,是一个分布式.分区的.多副本的.多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志.访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目. 主要应用场景是:日志收集系统和消息系统. Kafka主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能. 高吞吐率.即使在非…
一.简介 1.1 概述 Kafka是最初由Linkedin公司开发,是一个分布式.分区的.多副本的.多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志.访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目. 主要应用场景是:日志收集系统和消息系统. Kafka主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能. 高吞吐率.即使在非…