自己实现一个一致性 Hash 算法
前言
在前文分布式理论(八)—— Consistent Hash(一致性哈希算法)中,我们讨论了一致性 hash 算法的原理,并说了,我们会自己写一个简单的算法。今天就来写一个。
普通 hash 的结果
先看看普通 hash 怎么做。
首先,需要缓存节点对象,缓存中的存储对象,还有一个缓存节点集合,用于保存有效的缓存节点。
- 实际存储对象,很简单的一个类,只需要获取他的 hash 值就好:
 
  static class Obj {
    String key;
    Obj(String key) {
      this.key = key;
    }
    @Override
    public int hashCode() {
      return key.hashCode();
    }
    @Override
    public String toString() {
      return "Obj{" +
          "key='" + key + '\'' +
          '}';
    }
  }
- 缓存节点对象,用于存储实际对象:
 
  static class Node {
    Map<Integer, Obj> node = new HashMap<>();
    String name;
    Node(String name) {
      this.name = name;
    }
    public void putObj(Obj obj) {
      node.put(obj.hashCode(), obj);
    }
    Obj getObj(Obj obj) {
      return node.get(obj.hashCode());
    }
    @Override
    public int hashCode() {
      return name.hashCode();
    }
  }
也很简单,内部使用了一个 map 保存节点。
- 缓存节点集合,用于保存有效的缓存节点:
 
 static class NodeArray {
    Node[] nodes = new Node[1024];
    int size = 0;
    public void addNode(Node node) {
      nodes[size++] = node;
    }
    Obj get(Obj obj) {
      int index = obj.hashCode() % size;
      return nodes[index].getObj(obj);
    }
    void put(Obj obj) {
      int index = obj.hashCode() % size;
      nodes[index].putObj(obj);
    }
  }
内部一个数组,取数据时,通过取余机器数量获取缓存节点,再从节点中取出数据。
- 测试:当增减节点时,还能不能找到原有数据:
 
 /**
   * 验证普通 hash 对于增减节点,原有会不会出现移动。
   */
  public static void main(String[] args) {
    NodeArray nodeArray = new NodeArray();
    Node[] nodes = {
        new Node("Node--> 1"),
        new Node("Node--> 2"),
        new Node("Node--> 3")
    };
    for (Node node : nodes) {
      nodeArray.addNode(node);
    }
    Obj[] objs = {
        new Obj("1"),
        new Obj("2"),
        new Obj("3"),
        new Obj("4"),
        new Obj("5")
    };
    for (Obj obj : objs) {
      nodeArray.put(obj);
    }
    validate(nodeArray, objs);
  }
  private static void validate(NodeArray nodeArray, Obj[] objs) {
    for (Obj obj : objs) {
      System.out.println(nodeArray.get(obj));
    }
    nodeArray.addNode(new Node("anything1"));
    nodeArray.addNode(new Node("anything2"));
    System.out.println("========== after  =============");
    for (Obj obj : objs) {
      System.out.println(nodeArray.get(obj));
    }
  }
测试步骤如下:
- 向集合中添加 3 个节点。
 - 向 
集群中添加 5 个对象,这 5 个对象会根据 hash 值散列到不同的节点中。 - 打印 
未增减前的数据。 - 打印 
增加 2 个节点后数据,看看还能不能访问到数据。 
结果:

一个都访问不到了。这就是普通的取余的缺点,在增减机器的情况下,这种结果无法接收。
再看看一致性 hash 如何解决。
一致性 Hash 的结果
关键的地方来了。
缓存节点对象和实际保存对象不用更改,改的是什么?
改的是保存对象的方式和取出对象的方式,也就是不使用对机器进行取余的算法。
新的 NodeArray 对象如下:
static class NodeArray {
/** 按照 键 排序*/
TreeMap<Integer, Node> nodes = new TreeMap<>();
void addNode(Node node) {
  nodes.put(node.hashCode(), node);
}
void put(Obj obj) {
  int objHashcode = obj.hashCode();
  Node node = nodes.get(objHashcode);
  if (node != null) {
    node.putObj(obj);
    return;
  }
  // 找到比给定 key 大的集合
  SortedMap<Integer, Node> tailMap = nodes.tailMap(objHashcode);
  // 找到最小的节点
  int nodeHashcode = tailMap.isEmpty() ? nodes.firstKey() : tailMap.firstKey();
  nodes.get(nodeHashcode).putObj(obj);
}
Obj get(Obj obj) {
  Node node = nodes.get(obj.hashCode());
  if (node != null) {
    return node.getObj(obj);
  }
  // 找到比给定 key 大的集合
  SortedMap<Integer, Node> tailMap = nodes.tailMap(obj.hashCode());
  // 找到最小的节点
  int nodeHashcode = tailMap.isEmpty() ? nodes.firstKey() : tailMap.firstKey();
  return nodes.get(nodeHashcode).getObj(obj);
}
}
该类和之前的类的不同之处在于:
- 内部没有使用数组,而是使用了有序 Map。
 - put 方法中,对象如果没有落到缓存节点上,就找比他小的节点且离他最近的。这里我们使用了 TreeMap 的 tailMap 方法,具体 API 可以看文档。
 - get 方法中,和 put 步骤相同,否则是取不到对象的。
 
具体寻找节点的方式如图:

相同的测试用例,执行结果如下:

找到了之前所有的节点。解决了普通 hash 的问题。
总结
代码比较简单,主要是通过 JDK 自带的 TreeMap 实现的寻找临近节点。当然,我们这里也只是测试了添加,关于修改还没有测试,但思路是一样的。这里只是做一个抛砖引玉。
同时,我们也没有实现虚拟节点,感兴趣的朋友可以尝试一下。
good luck!!!!
自己实现一个一致性 Hash 算法的更多相关文章
- 对一致性Hash算法,Java代码实现的深入研究
		
一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...
 - 一致性hash算法详解
		
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...
 - 一致性hash算法简介
		
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...
 - 分布式缓存技术memcached学习(四)—— 一致性hash算法原理
		
分布式一致性hash算法简介 当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...
 - 一致性 hash 算法( consistent hashing )a
		
一致性 hash 算法( consistent hashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistent hashing and rando ...
 - 一致性hash算法简介与代码实现
		
一.简介: 一致性hash算法提出了在动态变化的Cache环境中,判定哈希算法好坏的四个定义: 1.平衡性(Balance) 2.单调性(Monotonicity) 3.分散性(Spread) 4.负 ...
 - memcache的一致性hash算法使用
		
一.概述 1.我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择.与常规的hash算法思路不同,只是对我们要存储数据的k ...
 - 一致性Hash算法在Redis分布式中的使用
		
由于redis是单点,但是项目中不可避免的会使用多台Redis缓存服务器,那么怎么把缓存的Key均匀的映射到多台Redis服务器上,且随着缓存服务器的增加或减少时做到最小化的减少缓存Key的命中率呢? ...
 - 【转载】一致性hash算法释义
		
http://www.cnblogs.com/haippy/archive/2011/12/10/2282943.html 一致性Hash算法背景 一致性哈希算法在1997年由麻省理工学院的Karge ...
 
随机推荐
- 一些仪器的解码程序(delphi)
			
http://www.jiandande.com/html/ITzixun-jishu/Lisyanjiuyuan/2013/0204/1600_3.html 看了后觉得不错,可能有需要的 ----- ...
 - 合成的默认构造函数定义为delete的一种情况(针对C++11标准)
			
1. 默认初始化 如果定义变量时没有指定初值,则变量会被默认初始化,此时变量被赋予了"默认值". 对于类类型的变量来说,初始化都是依靠构造函数来完成的.因此,即使定义某个类的变量( ...
 - asp.net core sdk & runtime 镜像[已更新至2.2.0]
			
在官方镜像的脚本上, 增加了System.Drawing相关的依赖库 以北京时间为默认的时间 2.2.0 Windows SDK地址: 官方: https://dotnetcli.blob.core. ...
 - Python 学习第二章
			
本章内容 数据类型 数据运算 表达式 if ...else 语句 表达式 for 循环 表达式 while 循环 一.数据类型 在内存中存储的数据可以有多种类型. 在 Python 有五个标准的数据类 ...
 - NET npoi  保存文件
			
npoi完整代码:NET npoi帮助类 public static void DataTableToExcel(List<DataTable> dataTables, string fi ...
 - 14_python 匿名函数,递归函数
			
一.匿名函数 语法: 函数名 = lambda 参数: 返回值 # lambda x,y,z=1:x+y+z 注意: 1.函数的参数可以有多个. 多个参数之间⽤逗号隔开 2.匿名函数不管多复杂 ...
 - Akka(20): Stream:异步运算,压力缓冲-Async, batching backpressure and buffering
			
akka-stream原则上是一种推式(push-model)的数据流.push-model和pull-model的区别在于它们解决问题倾向性:push模式面向高效的数据流下游(fast-downst ...
 - C# 中 DataTable转换成IList
			
在用C#作开发的时候经常要把DataTable转换成IList:操作DataTable比较麻烦,把DataTable转换成IList,以对象实体作为IList的元素,操作起来就非常方便. 注意:实体的 ...
 - OSX10.12搭建IPv6本地环境测试APP
			
前记 最近刚换了工作,生活终于又安定下来了,又可以更博了 正文 最近公司在上线APP(整体全是用JS去写的,就用了我原生的一个控制器),然后APP就去上线,就被苹果巴巴给拒了.通过阅读苹果回复的邮件, ...
 - 《Python编程从入门到实践》--- 学习过程笔记(3)列表
			
一.用[](方括号)表示列表,用,(逗号)分隔其中的元素. >>> name=['limei', 'hanmeimei', 'xiaoming'] >>> prin ...