01--是时候让我们谈谈一致性hash了

---------------------

假如你有图中三个盒子，我们有代号为 1，4，5，12 这四样东西那根据代号作为主键，将东西放到盒子了，该如何放置？

我们可以对代号取模 1 mod 3 = 1 4 mod 3 = 1 5 mod 3 = 2 12mod 3 = 0

这样的话大家就可以分配好到对应到盒子里

  1 #!/usr/bin/env python

  2

  3 box0 = []

  4 box1 = []

  5 box2 = []

  6 box_home = {

  7             '0':[],

  8             '1':[],

  9             '2':[],

 10         }

 11 res = [1,4,5,12]

 12

 13 for i in res:

 14     key = i % 3

 15     if key == 0:

 16         box_home[str(key)].append(i)

 17     elif key == 1:

 18         box_home[str(key)].append(i)

 19     elif key == 2:

 20         box_home[str(key)].append(i)

 21

 22 for k,v in box_home.items():

 23     print k,v

~

代码如上

-------------------------------------------------------------

但是如果现在加一个盒子。

就变成这样了

那么现在就要取模为4了之前箱子里面的东西都要重新计算重新，重新摆放。

这在很多场景是不能够接受的，比如负载均衡，我不能因为重新加了一个节点，让所有用户的长链接都断开，重新链接。

或许这种还能接受，那么如果是分布式存储呢？

所以这个时候我们不能够这样做。这样子都服务就不是无状态都服务。

这个时候就是一致性hash派上用场的时候了。

我们可以在刚刚分配的时候预留很多空位置。

圆形就是是空，矩形就是有箱子的。我们可以在一开始就留很多空白多地方，如图上

我们一开始有三个节点，但是我们会分配5个位置，然后有数据就mod6，如果数据分配到到是没有节点到位置

那么我就就把这个数据放到下一个有节点到位置，比如图上我们要分配到是数据8 那么8mod6 = 2 此时位置2上没有节点。那么将这个数据到下一个有节点到位置

也就是位置3。如果是mod到是最后一个那么就从头开始，也就是说，位置是环形的。

如有新的节点加入，那么直接放到空的位置上，然后将之前的分配在这个位置上的数据转移上去即可，这样子就能避免重新分配。

我们可以通过代码模拟分配情况

#!/usr/bin/env python

#coding:utf-8

class Node():

    def __init__(self,data,next_node = None,node_type = 'body',is_online=0):

        self.data = data

        self.next_node = next_node

        self.is_online = is_online

        self.node_type = node_type

        self.self_data = []

        self.other_data = []

    def get_next_node(self):

        return self.next_node

    def set_next_node(self,next_node):

        self.next_node = next_node

        return True

    def set_node_status(self,num):

        self.is_onlie  = num

    def get_data(self):

        return self.data

class boxs():

    def __init__(self,head=None):

        self.head_node = head

        self.size = 0

        self.ser_node = None

    def add_None(self,data,num):

        if self.head_node == None:

            self.head_node =Node(data,is_online=num)

            self.scr_node = self.head_node

            self.size +=1

        else:

            new_node = Node(data,is_online=num)

            self.scr_node.set_next_node(new_node)

            self.scr_node = new_node

            self.size +=1

    def print_list(self):

        curr = self.head_node

        while curr :

            print '-----------------------'

            print curr.data,'--->',curr.node_type,"---->",curr.is_online

            print "data:",curr.self_data

            print "other_data",curr.other_data

            if curr.node_type != 'body':

                break

            else:

                curr = curr.get_next_node()

    def set_ass_node(self,data,num):

        new_node = Node(data,node_type='tail',is_online=num)

        new_node.type = 'tail'

        self.scr_node.set_next_node(new_node)

        new_node.set_next_node(self.head_node)

    def insert_data(self,key,dick_len):

        curr = self.head_node

        while curr:

            if key % dick_len == curr.data:

                if curr.is_online == 1:

                    curr.self_data.append(key)

                else:

                    while 1:

                        curr = curr.get_next_node()

                        if curr.is_online == 1:

                            curr.other_data.append(key)

                            break

                break

            else:

                curr  = curr.get_next_node()

    def set_node_allot(self,key_dict,dick_len):

        for  key in key_dict:

            self.insert_data(key,dick_len)

#设置节点种有盒子的节点

online_node = [1,3,5]

#实例化链表

mylist  = boxs()

#添加节点，如果节点数属于online_node的节点 那么就设定他在线

for i in range(7):

    now_status = 0

    if i in online_node:

        now_status =1

    if i <6:

        mylist.add_None(i,now_status)

    else:

        mylist.set_ass_node(6,now_status)

#模拟数据

key_dict = [2,3,5,6,12,22,23,33]

#分配数据

mylist.set_node_allot(key_dict,len(key_dict)-1)

#打印分配情况

mylist.print_list()

01--是时候让我们谈谈一致性hash了的更多相关文章

转载自lanceyan：一致性hash和solr千万级数据分布式搜索引擎中的应用
一致性hash和solr千万级数据分布式搜索引擎中的应用互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得 ...
分布式缓存技术memcached学习（四）—— 一致性hash算法原理
分布式一致性hash算法简介当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...
一致性hash和solr千万级数据分布式搜索引擎中的应用
互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得成功,这个和当前的开源技术.海量数据架构有着必不可分的关 ...
分布式缓存技术memcached学习系列（四）—— 一致性hash算法原理
分布式一致性hash算法简介当你看到"分布式一致性hash算法"这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前, ...
php 实现一致性hash 算法 memcache
散列表的应用涉及到数据查找比对,首先考虑到使用HashSet.HashSet最大的好处就是实现查找时间复杂度为O(1).使用HashSet需要解决一个重要问题:冲突问题.对比研究了网上一些字符串哈希 ...
【转】分布式存储和一致性hash
本文我将对一致性算法作介绍,同时谈谈自己对一致性hash和一般意义上的hash算法的区别 hash是什么 hash即hash算法,又称为散列算法,百度百科的定义是哈希算法将任意长度的二进制值映射为较 ...
给面试官讲明白：一致性Hash的原理和实践
"一致性hash的设计初衷是解决分布式缓存问题,它不仅能起到hash作用,还可以在服务器宕机时,尽量少地迁移数据.因此被广泛用于状态服务的路由功能" 01分布式系统的路由算法假设 ...
一致性 Hash 在负载均衡中的应用
介一致性Hash是一种特殊的Hash算法,由于其均衡性.持久性的映射特点,被广泛的应用于负载均衡领域,如nginx和memcached都采用了一致性Hash来作为集群负载均衡的方案.本文将介绍一致性 ...
对一致性Hash算法，Java代码实现的深入研究
一致性Hash算法关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...

随机推荐

mysql5.6之前需要账号的安全加固
mysql5.6之前需要账号的安全加固从5.7开始就不需要了. delete from mysql.user where user!='root' or host='localhost'; flus ...
解决cdh4.5.0下 MAP任务看不到状态
参考 http://qnalist.com/questions/772595/yarn-jobhistory-service 在mapreduce-site.xml中添加 <property&g ...
多重网格方法(Multigridmethod)
原文链接多重网格方法是解微分方程的方法.这个方法的好处是在利用迭代法收敛结果的时候速度特别快.并且,不管是否对称,是否线性都无所谓.它的值要思想是在粗糙结果和精细结果之间插值. 前面介绍了Gauss ...
成员变量和成员函数前加static的作用？
成员变量和成员函数前加static的作用?答:它们被称为常成员变量和常成员函数,又称为类成员变量和类成员函数.分别用来反映类的状态.比如类成员变量可以用来统计类实例的数量,类成员函数负责这种统计的动作 ...
C#定义常量的两种方法
在C#中定义常量的方式有两种,一种叫做静态常量(Compile-time constant),另一种叫做动态常量(Runtime constant).前者用“const”来定义,后者用“readonl ...
C#静态成员和非静态成员
一.C#静态成员和非静态成员 1. C#静态成员和非静态成员当类中的某个成员使用static修饰符时,就会被声明为静态成员.类中的成员要么是静态成员,要么是非静态成员.一般情况下,静态成员属于整个类 ...
mask r-cnn
mask R-cnn, kaiming he的新作.可以同时完成object detection和segmentation,还可以做pose estimation,简直就是功能多多啊.在coco上测试 ...
AMD、CMD和CommonJS规范（转）
CommonJS规范 CommonJS是在浏览器环境之外构建JavaScript生态系统为目标产生的项目,比如服务器和桌面环境中.CommonJS规范是为了解决JavaScript的作用域问题而定义 ...
牛客小白月赛2 H 武【Dijkstra】
链接:https://www.nowcoder.com/acm/contest/86/H来源:牛客网题目描述其次,Sεlιнα(Selina) 要进行体力比武竞赛. 在 Sεlιнα 所在的城市, ...
MySQL 5.7基于GTID的主从复制环境搭建（一主一从）
Preface As wel all know,replication base on GTID with row format of binary log is comprehens ...

01--是时候让我们谈谈一致性hash了

01--是时候让我们谈谈一致性hash了的更多相关文章

随机推荐

热门专题