一致性hash算法以及其在分布式系统中的应用（转）

初始架构

策略1：每一次memcached请求随机发送到一台memcached机器

两个问题：

1、同一份数据可能被存在不同的机器上而造成数据冗余

2、有可能某数据已经被缓存但是访问却没有命中

策略2：保证对相同的key的访问会被发送到相同的服务器

h = Hash(key)%N

解决上面两个问题，但是引入新的问题——容错性和扩展性不好

容错性：指当系统中某一个或几个服务器变得不可用时，整个系统是否可以正确高效运行

扩展性：指当加入新的服务器后，整个系统是否可以正确高效运行

当减少一台服务器，需要按照Hash(key)%(N-1)

当增加一台服务器，需要按照Hash(key)%(N+1)

当系统中一旦服务器变更，大量的key会重定位到不同的服务器从而能造成大量的缓存不命中。

一个设计良好的分布式哈希方案应该具有良好的单调性，即服务器节点的增减不会造成大量哈希重定位。

策略3：一致性哈希算法

算法描述

一致性哈希将整个哈希值空间组织成一个虚拟的圆环，如假设某哈希函数H的值空间为0-2**32-1(哈希值是一个32位无符号整形)，整个哈希空间环如下：

定位服务器

将各个服务器使用H进行一个哈希，具体可以选择服务器的ip或者主机名作为关键字进行哈市，这样每台机器就能确定其在哈希环上的位置

定位数据

将数据key使用相同的函数H计算出哈希值h，通过h确定在数据在环上的位置，从此位置沿环顺时针行走，第一台遇到的服务器就是其应该定位的服务器。

假设有A、B、C、D四个数据对象，经过哈希计算后，在环空间上的位置如下：

A被定位Server1，D被定位Server3,B和C定位Server2

容错性与可扩展性分析

容错性

假如说Server3宕机了

可以看到此时A、C、B不会受影响，只有D节点被重定位到Server2

在一致性哈希算法中，如果一台服务器不可用，则受影响的数据仅仅是此服务器到其环空间中前一台服务器之间的数据，其他不会受影响。

可扩展性

增加一台服务器

A、D、C不受影响，只有B需要重定位新的Server4。在一致性哈希算法中，如果增加一台服务器，则受影响的数据仅仅是新服务器到其环空间中前一台服务器（即顺子逆时针行走遇到的第一台服务器）

之间数据，其他不会受影响。

一致性哈希算法对于节点的增减都只需要重定位环空间中的一小部分数据，具有较好的容错性和可扩展性。

虚拟节点

一致性哈希算法在服务节点很少，容易因为节点分布不均匀而造成数据倾斜问题。

此时必然造成大量数据集中在server1上，而只有极少量在server2上。

为了解决这种数据倾斜问题，一致性哈希算法引入虚拟节点机制。

对每个服务节点计算多个哈希值，每个计算结果位置都防止一个此服务节点，称为虚拟节点。

“Memcached Server 1#1”
“Memcached Server 1#2”

“Memcached Server 1#3”

“Memcached Server 2#1”

“Memcached Server 2#2”

“Memcached Server 2#3”

形成六个节点

http://blog.codinglabs.org/articles/consistent-hashing.html

http://www.codeproject.com/Articles/56138/Consistent-hashing

一致性hash算法以及其在分布式系统中的应用（转）的更多相关文章

一致性Hash算法在数据库分表中的实践
最近有一个项目,其中某个功能单表数据在可预估的未来达到了亿级,初步估算在90亿左右.与同事详细讨论后,决定采用一致性Hash算法来完成数据库的自动扩容和数据迁移.整个程序细节由我同事完成,我只是将其理 ...
一致性Hash算法在Redis分布式中的使用
由于redis是单点,但是项目中不可避免的会使用多台Redis缓存服务器,那么怎么把缓存的Key均匀的映射到多台Redis服务器上,且随着缓存服务器的增加或减少时做到最小化的减少缓存Key的命中率呢? ...
一致性Hash算法在Memcached中的应用
前言大家应该都知道Memcached要想实现分布式只能在客户端来完成,目前比较流行的是通过一致性hash算法来实现.常规的方法是将server的hash值与server的总台数进行求余,即hash% ...
（转）一致性Hash算法在Memcached中的应用
前言大家应该都知道Memcached要想实现分布式只能在客户端来完成,目前比较流行的是通过一致性hash算法来实现.常规的方法是将 server的hash值与server的总台数进行求余,即hash ...
jedis中的一致性hash算法
[http://my.oschina.net/u/866190/blog/192286] jredis是redis的java客户端,通过sharde实现负载路由,一直很好奇jredis的sharde如 ...
一致性hash算法在memcached中的使用
一.概述 1.我们的memcacheclient(这里我看的spymemcache的源代码).使用了一致性hash算法ketama进行数据存储节点的选择.与常规的hash算法思路不同.仅仅是对我们要存 ...
LB中使用到的一致性Hash算法的简单实现
1.类的Diagram 2.代码实现 2.1.Node类,每个Node代表集群里面的一个节点或者具体说是某一台物理机器: package consistencyhash; import lombok. ...
【转载】一致性hash算法释义
http://www.cnblogs.com/haippy/archive/2011/12/10/2282943.html 一致性Hash算法背景一致性哈希算法在1997年由麻省理工学院的Karge ...
分布式算法(一致性Hash算法)
一.分布式算法在做服务器负载均衡时候可供选择的负载均衡的算法有很多,包括: 轮循算法(Round Robin).哈希算法(HASH).最少连接算法(Least Connection).响应速度算法( ...

随机推荐

java泛型使用总结
1. 泛型方法: 2. 泛型类: 3. 通配符. 1.泛型方法泛型方法在调用时可以接收不同类型的参数.根据传递给泛型方法的参数类型,编译器适当地处理每一个方法调用. 下面是定义泛型方法的规则: 所有 ...
IDL 创建数组
1.赋值创建通过方括号[]赋值创建数组,示例代码如下 IDL> arr=[1,2,3] IDL> help,arr ARR INT = Array[3] IDL> arr=[[1, ...
吐槽CSDN--想赚钱想疯了--强行升级皮肤--增加广告位
一直对CSDN很有好感,和博客园同是技术分享的好平台,但是界面更清爽,用户间互动也较多.在学生时代就一直在用,平时抄个作业,竞赛搜个题,论文需要凑字数等等.当年为了下载一份源代码,或者为了下载某本买不 ...
吾八哥学Python(五)：Python基本数学运算
今天我们学习Python里的基本数学运算方法,还是通过例子来练习吧! 加减乘除求余 #加法 print(12+34) #减法 print(30-10.0) #乘法 print(3*5) #除法 pri ...
Akka（29）： Http：Server-Side-Api，Low-Level-Api
Akka-http针对Connection的两头都提供了方便编程的Api,分别是Server-Side-Api和Client-Side-Api.通过这两个Api可以大大提高编程效率.当然,上期我们提到 ...
admin的基础配置
admin自定义配置一.admin.py 我们知道在models.py文件中创建的数据表,一方面我们可以通过视图函数对其进行增删改查,一方面我们也可以通过admin进行,通常我们是通过admin的前 ...
【转】ARM vs X86 – Key differences explained!
原文:http://www.androidauthority.com/arm-vs-x86-key-differences-explained-568718/ Android supports 3 d ...
NOIP2015运输计划（树上前缀和+LCA+二分）
Description 公元 2044 年,人类进入了宇宙纪元. L 国有 n 个星球,还有 n−1 条双向航道,每条航道建立在两个星球之间,这 n−1 条航道连通了 L 国的所有星球. 小 P 掌管 ...
Quart.Net分布式任务管理平台
无关主题:一段时间没有更新文章了,与自己心里的坚持还是背驰,虽然这期间在公司做了统计分析,由于资源分配问题,自己或多或少的原因,确实拖得有点久了,自己这段时间也有点松懈,借口就不说那么多 ...
负载均衡集群企业级应用实战—LVS
一.负载均衡集群介绍 1.集群 ① 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能.可靠性.灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技 ...

一致性hash算法以及其在分布式系统中的应用（转）

一致性hash算法以及其在分布式系统中的应用（转）的更多相关文章

随机推荐

热门专题