首先解释一下我的标题,用到了 分布式 和 集群两个单词,
为什么是集群?
解决[相同业务]问题的服务器多个以上就称为集群.这里memcached就是做相同任务的(提供缓存服务)
为什么是分布式?
虽然针对的是同样的任务(缓存),但是每一台memcached存储的数据不一样,这就叫分布式.

有很多架构是 分布式的但不叫集群(比如 把订单处理,和商品库存 分配到不同服务器上独立部署,这叫分布式),
有很多是 集群架构但是不一定是分布式的(比如 应用服务器集群,每一台服务器上的资源一样)

通常来说一般的集群部署表现为  一群memcached服务器 加  一台或多台 负载均衡服务器,
应用程序 要set 一个缓存,首先是发送到 负载均衡服务器,然后由负载均衡服务器通过负载均衡算法
分配到一台memcached服务器来存储,get 一个缓存也是同理.如下图:

但是目前我没有看到有针对 memcached 可用的负载均衡服务器成品,
对于memcached这种火热的缓存没道理没有解决方案啊,难道有其他的架构方式?

我翻阅了网上很多关于memcached的分布式解决方案,都没有中间负载均衡服务器,而是把均衡算法交给
了应用程序(客户端)来完成

常见的两种负载算法  取模,一致性hash

取模算法的原理:
根据 set/get 的hash(key)值 对集群中memcached的个数取模,就可以均匀的分配到每一台memcached服务器
例如 有3台memcacehed,如果 hash(key)=200923780;  200923780 mod 3 = 1
现在需要往集群里面添加一台memcached , 200923780 mod 4 = 0;
看出来了吗,还是原来的key  但是因为集群的memcached数量不一样了,导致最后链接的memcached server变了,
3台memcached扩容到4台,大约有75%的缓存不能正确命中,当100台集群中加一台,不能命中的概率是 99% (n(n+1)),
这个结果在大型系统中是不允许的.
当然不考虑集群的伸缩性,这种算法效率其实是最高的,但是作为一个高素质的架构师
怎么可能设计一个不能伸缩性的架构呢?

一致性hash算法的原理是:

按照集群中 server的ip 计算到 hash(ip),[这个地方的hash就是crc32],得到的值 放到下面的x轴上,

如下图,有三个memcached服务器通过hash分别放到了具体位置上,现在应用程序 通过 set/get 的key也进行crc32(key) 落到了下面的位置.

如图,key1落到了mem3和mem2之间,那么规定key1朝着箭头的方向找到的第一个memcached就作为目标,根据这个

规定,key2的目标就是mem2,key3由于向箭头方向已经找不到了,那么就取反方向第一个mem1作为目标.

现在再往集群中加一台memcached服务器mem-4:

落到mem-1和mem-3上的缓存没有收到一点点影响,mem-2也只收到了一定的影响, mem-1和mem-4这一截的缓存落到了mem-4上,mem-4和mem-2这一截仍然落在mem-2上.

随着机器越多,新增和减少集群机器影响变得更小.

难道这样就完美了?

上图其实画得很理想化,因为hash的随机行很大,所以memcached 通过hash(ip)后在x轴上的分布可能是这样的:

大量的key落在了mem1上,这看起来一点都不均衡O**O

那怎么让他均衡呢,

翻阅了网上很多文章,基本上是使用虚拟环,原理是:

为每一个 物理 memcached 分配100-150个虚拟节点,key落在虚拟节点上,通过虚拟节点找到实际的物理节点.如图:

虚拟节点越多,分布越均匀,但是越多也会增加找节点的时间,需要找到一个平衡点,推荐 100-150,

php的memcached扩展中已经实现了一致性hash存储的算法,代码实例:

<?php

$mem = new Memcached();
$mem->setOption(Memcached::OPT_HASH, Memcached::HASH_CRC);
$mem->setOption(Memcached::OPT_DISTRIBUTION, Memcached::DISTRIBUTION_CONSISTENT);
$servers = array(
array('127.0.0.1', 11211, 33),
array('127.0.0.1', 11212, 67)
);
$mem->addServers($servers); $mem->set('key1','value1');
echo '<br/>';
print_r($mem->get('key1'));
echo '<br/>';
$mem->set('key2','value2');
echo '<br/>';
print_r($mem->get('key2'));
echo '<br/>';

这种算法是 php-memcahed扩展提供的,如果追求灵活和可控,可以用纯php实现同样的负载算法,但是执行效率可能会下降.

如果追求效率,也可以用c语言写一个扩展.

我在接下来的博客中会进一步的扩展相关知识

Memcached 分布式集群的更多相关文章

  1. Memcached【Magent+Memcached】集群

    Memcached介绍  事件处理libevent是个程序库,它将Linux的epoll.BSD类操作系统的kqueue等事件处理功能封装成统一的接口.即使对服务器的连接数增加,也能发挥O(1)的性能 ...

  2. elasticsearch 口水篇(5)es分布式集群初探

    es有很多特性,分布式.副本集.负载均衡.容灾等. 我们先搭建一个很简单的分布式集群(伪),在同一机器上配置三个es,配置分别如下: cluster.name: foxCluster node.nam ...

  3. Twemproxy 分布式集群缓存代理服务器

    Twemproxy 分布式集群缓存代理服务器 是一个使用C语言编写.以代理的方式实现的.轻量级的Redis代理服务器, 它通过引入一个代理层,将应用程序后端的多台Redis实例进行统一管理, 使 应用 ...

  4. spring-session实现分布式集群session的共享

    前言 HttpSession是通过Servlet容器创建和管理的,像Tomcat/Jetty都是保存在内存中的.但是我们把应用搭建成分布式的集群,然后利用LVS或Nginx做负载均衡,那么来自同一用户 ...

  5. Apache shiro集群实现 (五)分布式集群系统下的高可用session解决方案

    Apache shiro集群实现 (一) shiro入门介绍 Apache shiro集群实现 (二) shiro 的INI配置 Apache shiro集群实现 (三)shiro身份认证(Shiro ...

  6. Nginx+Tomcat+Memcached 实现集群部署时Session共享

    Nginx+Tomcat+Memcached 实现集群部署时Session共享 一.简介 我们系统经常要保存用户登录信息,有Cookie和Session机制,Cookie客户端保存用户信息,Sessi ...

  7. Redis面试题及分布式集群

    Reference: http://blog.csdn.net/yajlv/article/details/73467865 1. 使用Redis有哪些好处? (1) 速度快,因为数据存在内存中,类似 ...

  8. spring-session实现分布式集群session的共享(转)

    原文: https://www.cnblogs.com/youzhibing/p/7348337.html HttpSession是通过Servlet容器创建和管理的,像Tomcat/Jetty都是保 ...

  9. Elasticsearch学习系列七(Es分布式集群)

    核心概念 集群(Cluster) 一个Es集群由多个节点(Node)组成,每个集群都有一个共同的集群名称作为标识 节点(Node) 一个Es实例就是一个Node.Es的配置文件中可以通过node.ma ...

随机推荐

  1. reedis 解决在windows下启动闪退

    windows下安装https://github.com/MicrosoftArchive/redis/releases第一次启动报错: [2368] 21 Apr 02:57:05.611 # Cr ...

  2. Java多线程(八)——join()

    一.join()介绍 join() 定义在Thread.java中.join() 的作用:让“主线程”等待“子线程”结束之后才能继续运行.这句话可能有点晦涩,我们还是通过例子去理解: // 主线程 p ...

  3. HAProxy基础

    一.简介 HAProxy是由C语言编写基于事件驱动模型的一款高效稳定.功能强大的负载均衡软件,其性能可媲美商业负载均衡软件,不过在最新的版本中HAProxy已经分为社区版本和企业版,社区版完全免费,企 ...

  4. 蓝牙BLE设备断线回连分析

    在 文章中分析了Hogp的连接的流程 ,这里分析一下回连的流程. 在使用ble设备的过程中,我们发现当设备和主机配对之后,如果没有解除配对,那么即便设备和主机断开,那么也是可以重新连接而不需要重新走配 ...

  5. FineUI经典项目展示(2)基础管理系统(附在线演示)

    本系列<FineUI经典项目展示>文章将会集中展示一批使用FineUI(开源版).专业版.MVC版的经典项目. 如果你希望自己的FineUI项目出现在这个舞台,请到官网论坛提交申请: ht ...

  6. 【C#复习总结】多线程编程

    1 基本概念 前一篇文章做了铺垫,详见:http://www.cnblogs.com/mhq-martin/p/9035640.html 2 多线程 多线程的优点:可以同时完成多个任务:可以使程序的响 ...

  7. 朱晔的互联网架构实践心得S1E3:相辅相成的存储五件套

    朱晔的互联网架构实践心得S1E3:相辅相成的存储五件套 [下载本文PDF进行阅读] 这里所说的五件套是指关系型数据库.索引型数据库.时序型数据库.文档型数据库和缓存型数据库. 上图显示了一套读写服务搭 ...

  8. oracle表空间不足,ORA-00604的解决方法

    参考文章: http://blog.chinaunix.net/uid-26446098-id-3344813.html 错误信息如下: 从错误的角度可以推出:应该是表空间不足 根据查看表空间的使用情 ...

  9. Win10系统如何安装Linux Mint

    导读 随着windows10系统免费升级期限的靠近,越来越多朋友都将自己的电脑系统升级到了win10正式版.今天,小编就要在这里为大家分享Windows10系统安装Linux Mint的方法,希望能够 ...

  10. Stack Sorting CodeForces - 911E (思维+单调栈思想)

    Let's suppose you have an array a, a stack s (initially empty) and an array b (also initially empty) ...