问题提出

一致性hash是什么?假设有4台缓存服务器N0,N1,N2,N3,现在需要存储数据OBJECT1,OBJECT2,OBJECT3,OBJECT4,OBJECT5,OBJECT5,OBJECT7,OBJECT8,
我们需要将这些数据缓存到这4台服务器上,相应的问题是

如何设计数据存放策略?即ObjectX 应该存放在哪台服务器上?

为了解决这个问题,我们有如下几个思路。

1. 余数hash方案

采用hash(Objectx)%4来确定服务器节点

假设 hash(OBJECT1)=2,由 2%4=2,可知,Object1则应该存放到节点N2
假设 hash(OBJECT2)=3,由 3%4=3,可知,Object2则应该存放到节点N3
假设 hash(OBJECT3)=1,由 1%4=1,可知,Object3则应该存放到节点N1
假设 hash(OBJECT4)=0,由 1%4=1,可知,Object4则应该存放到节点N0
假设 hash(OBJECT5)=5,由 5%4=1,可知,Object5则应该存放到节点N1
假设 hash(OBJECT6)=6,由 6%4=2,可知,Object6则应该存放到节点N2
假设 hash(OBJECT7)=7,由 7%4=3,可知,Object7则应该存放到节点N3
假设 hash(OBJECT8)=8,由 8%4=0,可知,Object8则应该存放到节点N0

假设我们需要读取Object3的数据,则由hash(object3)=1可知,我们只需要访问节点N1即可。

1.1 现在假设N3忽然故障下线

我们面临缓存重新构造的问题

采用hash(Objectx)%3来确定服务器节点

假设 hash(OBJECT1)=2,由 2%3=2,可知,Object1则应该存放到节点N2
假设 hash(OBJECT2)=3,由 3%3=0,可知,Object2则应该存放到节点N0
假设 hash(OBJECT3)=1,由 1%3=1,可知,Object3则应该存放到节点N1
假设 hash(OBJECT4)=0,由 0%3=0,可知,Object4则应该存放到节点N0
假设 hash(OBJECT5)=5,由 5%3=2,可知,Object5则应该存放到节点N2
假设 hash(OBJECT6)=6,由 6%3=0,可知,Object6则应该存放到节点N0
假设 hash(OBJECT7)=7,由 7%3=1,可知,Object7则应该存放到节点N1
假设 hash(OBJECT8)=8,由 8%3=2,可知,Object8则应该存放到节点N2

此时为了保证数据的准确性,我们需要
将数据Object2N3迁移到N0
将数据Object5N1迁移到N2
将数据Object6N2迁移到N0
将数据Object7N3迁移到N1
将数据Object8N0迁移到N2

1.2 现在假设我们添加一台新的服务器N4

我们面临缓存重新构造的问题

采用hash(Objectx)%5来确定服务器节点

假设 hash(OBJECT1)=2,由 2%5=2,可知,Object1则应该存放到节点N2
假设 hash(OBJECT2)=3,由 3%5=3,可知,Object2则应该存放到节点N3
假设 hash(OBJECT3)=1,由 1%5=1,可知,Object3则应该存放到节点N1
假设 hash(OBJECT4)=0,由 0%5=0,可知,Object4则应该存放到节点N0
假设 hash(OBJECT5)=5,由 5%5=0,可知,Object5则应该存放到节点N0
假设 hash(OBJECT6)=6,由 6%5=1,可知,Object6则应该存放到节点N1
假设 hash(OBJECT7)=7,由 7%5=2,可知,Object7则应该存放到节点N2
假设 hash(OBJECT8)=8,由 8%5=3,可知,Object8则应该存放到节点N3

此时为了保证数据的准确性,我们需要

将数据Object2N3迁移到N0
将数据Object5N1迁移到N0
将数据Object6N2迁移到N1
将数据Object7N3迁移到N2
将数据Object8N0迁移到N3

从上述俩种情况可以看出,一旦机器数目变化,我们面临大量的缓存变化问题,换言之,缓存大部分失效,很可能会导致雪崩。

2.一致性hash方案

现在我们更换如下策略

0<hash(Objectx)%8<=2 ,则存放在N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=6 ,则存放在N2
6<hash(Objectx)%8<=8 ,则存放在N3

2.1 现在假设N3忽然故障下线

我们面临缓存重新构造的问题,调整策略如下

0<hash(Objectx)%8<=2 ,则存放在N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=6 ,则存放在N2
6<hash(Objectx)%8<=8 ,则存放在N0

此时为了保证数据的准确性,我们需要
将数据ObjectXN3迁移到N0,受影响的数据仅仅N3相关的数据。

2.2 现在假设我们添加一台新的服务器N4

我们面临缓存重新构造的问题,调整策略如下

0<hash(Objectx)%8<=2 ,则存放在N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=5 ,则存放在N2
5<hash(Objectx)%8<=6 ,则存放在N4
6<hash(Objectx)%8<=8 ,则存放在N3

此时为了保证数据的准确性,我们需要
将数据从N2复制到N4,受影响的仅仅N2相关的用户。

比较上述俩种做法,可见方案2更优. 方案2就是一致性hash

2.3 缺点

机器越少,则每台机器上负载将越不均匀,解决这个问题的方法是添加虚拟节点,调整策略,如下,可以想象,数据越多,分布越均匀。

0<hash(Objectx)%8<=1 ,则存放在N0
1<hash(Objectx)%8<=2 ,则存放在N1
2<hash(Objectx)%8<=3 ,则存放在N2
3<hash(Objectx)%8<=4 ,则存放在N3
4<hash(Objectx)%8<=5 ,则存放在N0
5<hash(Objectx)%8<=6 ,则存放在N1
6<hash(Objectx)%8<=7 ,则存放在N2
7<hash(Objectx)%8<=8 ,则存放在N3

3. 一致性Hash原理

原理网络上太多,这里不做进一步阐述。

推荐阅读

扫微信二维码实现网站登陆提供体验地址和源代码

开源项目golang go语言后台管理框架restgo-admin

支持手势触摸,可左右滑动的日历插件

你必须知道的18个互联网业务模型

推荐阅读

扫微信二维码实现网站登陆提供体验地址和源代码

开源项目golang go语言后台管理框架restgo-admin

支持手势触摸,可左右滑动的日历插件

你必须知道的18个互联网业务模型

关于一致性hash,这可能是全网最形象生动最容易理解的文档,想做架构师的你来了解一下的更多相关文章

  1. 对一致性Hash算法,Java代码实现的深入研究

    一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...

  2. 转载自lanceyan: 一致性hash和solr千万级数据分布式搜索引擎中的应用

    一致性hash和solr千万级数据分布式搜索引擎中的应用 互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得 ...

  3. 一致性hash算法详解

    转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179     一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...

  4. 探索c#之一致性Hash详解

    阅读目录: 使用场景 算法原理 虚拟节点 代码示例 使用场景 以Redis为例,当系统需要缓存的内容超过单机内存大小时,例如要缓存100G数据,单机内存仅有16G时.这时候就需要考虑进行缓存数据分片, ...

  5. 一致性hash算法简介

    一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...

  6. 分布式缓存技术memcached学习(四)—— 一致性hash算法原理

    分布式一致性hash算法简介 当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...

  7. 关于Memcached一致性hash的探究

    参考文章 http://blog.chinaunix.net/uid-20498361-id-4303232.html http://blog.csdn.net/kongqz/article/deta ...

  8. 一致性 hash 算法( consistent hashing )a

    一致性 hash 算法( consistent hashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistent hashing and rando ...

  9. Ceph剖析:数据分布之CRUSH算法与一致性Hash

    作者:吴香伟 发表于 2014/09/05 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 数据分布是分布式存储系统的一个重要部分,数据分布算法至少要考虑以下三个 ...

随机推荐

  1. Mac Sublime Text使用python3运行脚本(command+b)

    默认安装好sublime, 使用快捷键command+b的时候, 会使用python2版本运行 下面就改为用python3运行, 也可以python2运行 一. 新建文件 Sublime Text - ...

  2. [RN] React Native 仿美团下拉筛选菜单控件

    React Native 仿美团下拉筛选菜单控件 演示效果如下: 使用方法如下: 1.安装 npm install react-native-dropdownmenus --save react-na ...

  3. C++ Boost

    Boost库是一个可移植.提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一. Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容.在C+ ...

  4. SDOI 二轮垫底鸡

    SDOI 二轮垫底鸡 day0 准备爆零 没啥好准备考试的,12.00出发,试机敲抄个ntt,在宾馆不知道颓啥. day1 爆零爬山 T1noip的题目也放到省选上. 第一档线段树?肯定不写,直接上1 ...

  5. linux命令之------which命令/cp命令/Head及tail命令/grep命令/pwd命令/cd命令/df命令/mkdir命令/mount及umount命令/ls命令/history命令/ifconfig命令/ping命令/useradd命令/命令passwd/kill命令/su命令/clear命令/ssh命令/tar解压缩/远程拷贝scp

    which命令 1)    作用:搜索某个系统命令的位置. 2)    案例:查询vi命令路径:which vi cp命令 1)作用:用于复制文件或目录: 2)-a:此选项通常使用在复制目录时使用,它 ...

  6. 《京东上千页面搭建基石——CMS前后端分离演进史》阅读笔记

    一.背景 CMS即内容管理系统,目的是用于快速进行网站建设或者网页开发. 对于京东网站部门来说,CMS核心目的是用来快速开发和上线各种页面,诸如各种垂直频道页. 二.CMS核心目的 进行数据和模板的统 ...

  7. 万恶技术系列笔记-jupyter工作路径和源文件打开方式

    万恶技术系列笔记-jupyter工作路径和源文件打开方式   脚本文件,ipynb的正确打开姿势: ipynb不能直接打开,需要复制到工作路径.例如 10_monkeys_model_1.ipynb ...

  8. zz 勵志貼,成功是努力加对的方向

    5-6年工作经验程序员初进大厂,如何适应工作? 李苦李 李苦李 ​ 华为 架构师 318 人赞同了该回答 泻药! 与题主背景非常相似. 本人毕业8年+,普通二本,学历不突出,非计算机专业. 唯一不同的 ...

  9. 大话图解golang map

    前言 网上分析golang中map的源码的博客已经非常多了,随便一搜就有,而且也非常详细,所以如果我再来写就有点画蛇添足了(而且我也写不好,手动滑稽).但是我还是要写,略略略,这篇博客的意义在于能从几 ...

  10. mysql插入报错:java.sql.SQLException: Incorrect string value: '\xE6\x9D\xAD\xE5\xB7\x9E...' for column 'address' at row 1

    界面报错: 日志报错: java.sql.SQLException: Incorrect at com.mysql.cj.jdbc.exceptions.SQLError.createSQLExcep ...