[leetcode/lintcode 题解] 一致性哈希 II

【题目描述】

在 Consistent Hashing I 中我们介绍了一个比较简单的一致性哈希算法，这个简单的版本有两个缺陷：

增加一台机器之后，数据全部从其中一台机器过来，这一台机器的读负载过大，对正常的服务会造成影响。
当增加到3台机器的时候，每台服务器的负载量不均衡，为1:1:2。

为了解决这个问题，引入了 micro-shards 的概念，一个更好的算法是这样：

将 360° 的区间分得更细。从 0~359 变为一个 0 ~ n-1 的区间，将这个区间首尾相接，连成一个圆。
当加入一台新的机器的时候，随机选择在圆周中撒 k 个点，代表这台机器的 k 个 micro-shards。
每个数据在圆周上也对应一个点，这个点通过一个 hash function 来计算。
一个数据该属于哪台机器负责管理，是按照该数据对应的圆周上的点在圆上顺时针碰到的第一个 micro-shard 点所属的机器来决定。

n 和 k在真实的 NoSQL 数据库中一般是 2^64 和 1000。

请实现这种引入了 micro-shard 的 consistent hashing 的方法。主要实现如下的三个函数：

create(int n, int k)
addMachine(int machine_id) // add a new machine, return a list of shard ids.
getMachineIdByHashCode(int hashcode) // return machine id

在线评测地址:

https://www.lintcode.com/problem/consistent-hashing-ii/?utm_source=sc-bky-zq

【样例】

样例 1:

输入:

  create(, )

  addMachine()

  getMachineIdByHashCode()

  addMachine()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

输出:

  [,,]

  [,,]

样例 2:

输入:

  create(, )

  addMachine()

  getMachineIdByHashCode()

  addMachine()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

  getMachineIdByHashCode()

输出:

  [,,,,]

  [,,,,]

【题解】

public class Solution {

    public int n, k;

    public Set<Integer> ids = null;

    public Map<Integer, List<Integer>> machines = null;

    // @param n a positive integer

    // @param k a positive integer

    // @return a Solution object

    public static Solution create(int n, int k) {

        // Write your code here

        Solution solution = new Solution();

        solution.n = n;

        solution.k = k;

        solution.ids = new TreeSet<Integer>();

        solution.machines = new HashMap<Integer, List<Integer>>();

        return solution;

    }

    // @param machine_id an integer

    // @return a list of shard ids

    public List<Integer> addMachine(int machine_id) {

        // Write your code here

        Random ra = new Random();

        List<Integer> random_nums = new ArrayList<Integer>();

        for (int i = 0; i < k; ++i) {

            int index = ra.nextInt(n);

            while (ids.contains(index))

                index = ra.nextInt(n);

            ids.add(index);

            random_nums.add(index);

        }

        Collections.sort(random_nums);

        machines.put(machine_id, random_nums);

        return random_nums;

    }

    // @param hashcode an integer

    // @return a machine id

    public int getMachineIdByHashCode(int hashcode) {

        // Write your code here

        int distance = n + 1;

        int machine_id = 0;

        for (Map.Entry<Integer, List<Integer>> entry : machines.entrySet()) {

            int key = entry.getKey();

            List<Integer> random_nums = entry.getValue();

            for (Integer num : random_nums) {

                int d = num - hashcode;

                if (d < 0)

                    d += n;

                if (d < distance) {

                    distance = d;

                    machine_id = key;

                }

            }

        }

        return machine_id;

    }

}

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II的更多相关文章

（转）每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)
背景:在redis集群中,有关于一致性哈希的使用. 一致性哈希:桶大小0~(2^32)-1 哈希指标:平衡性.单调性.分散性.负载性为了提高平衡性,引入“虚拟节点” 每天进步一点点——五分钟理解一致 ...
一致性哈希算法(consistent hashing)（转）
原文链接:每天进步一点点——五分钟理解一致性哈希算法(consistent hashing) 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网 ...
一致性哈希算法(Consistent Hashing Algorithm)
一致性哈希算法(Consistent Hashing Algorithm) 浅谈一致性Hash原理及应用在讲一致性Hash之前我们先来讨论一个问题. 问题:现在有亿级用户,每日产生千万级订单,如 ...
转白话解析：一致性哈希算法 consistent hashing
摘要: 本文首先以一个经典的分布式缓存的应用场景为铺垫,在了解了这个应用场景之后,生动而又不失风趣地介绍了一致性哈希算法,同时也明确给出了一致性哈希算法的优点.存在的问题及其解决办法. 声明与致谢: ...
白话解析：一致性哈希算法 consistent hashing【转】
学习一致性哈希算法原理的时候看到博主朱双印的一片文章,看完就懂,大佬! 白话解析:一致性哈希算法 consistent hashing
_00013 一致性哈希算法 Consistent Hashing 新的讨论，并出现相应的解决
笔者博文:妳那伊抹微笑博客地址:http://blog.csdn.net/u012185296 个性签名:世界上最遥远的距离不是天涯,也不是海角,而是我站在妳的面前.妳却感觉不到我的存在技术方向: ...
一致性哈希算法(consistent hashing)PHP实现
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...
五分钟理解一致性哈希算法(consistent hashing)
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法 ...
每天进步一点点——五分钟理解一致性哈希算法(consistent hashing)
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...

随机推荐

PHPstudy 2018 集成环境项目配置虚拟域名访问
1.首先启动PHPstudy2018,并停止它 2.点击“其他选项菜单->站点域名管理” 3.设置站点域名.项目目录,点击“新增”,再点击“保存并生成配置文件” 4.生产配置文件之后会重启,然后 ...
LIMS产品 - Labware
软件架构客户端:Labware软件,部分C/S功能 Web服务:Apache Tomcat等,部分B/S功能后台服务:计划.调度程序,环境监控样.稳定性研究等数据库驱动:ODBC 报表工具:水晶 ...
Git报错信息
1. 解决办法: 当在最后提交的时候,出现的错误. 解决办法: git remote rm origin 执行下面代码: git remote add origin https://github.co ...
深入解读Dictionary
Dictionary<TKey,TValue>是日常.net开发中最常用的数据类型之一,基本上遇到键值对类型的数据时第一反应就是使用这种散列表.散列表特别适合快速查找操作,查找的效率是常数 ...
python实现将大文件夹分割成多个子文件夹
楼主用的linux,一旦数据达到几万,文件夹打开就会变卡,同时也方便同时分工协作,便于git管理,写了个将大文件夹分割成多个小文件夹的脚本如操作文件夹:img,脚本不破坏img的数据,创建img_1 ...
node+ajax实战案例（5)
6.添加客户 6.1.点击添加按钮,弹出表单框 // 添加用户显示对话框 var addBtn = document.getElementById('add-btn'); var addUser = ...
基本 Docker 命令列表
docker build -t friendlyname .# 使用此目录的 Dockerfile 创建镜像 docker run -p 4000:80 friendlyname # 运行端口 400 ...
Unable to load configuration. - action - file:/C:/Program%20Files/Apache%20Software%20Foundation/Tomcat%209.0/webapps/Teacher04/WEB-INF/classes/struts.xml:9:54
发布一个struts2项目的时候tomcat显示下面这个错误,我的本能感觉就是我的struts.xml或者web.xml写错了,可是我字母找都没发现,于是百度一番,可是我对那些人的回答表示怀疑,感觉应 ...
java语言进阶（六）_线程_同步
第一章多线程想要设计一个程序,边打游戏边听歌,怎么设计? 要解决上述问题,需要使用多进程或者多线程来解决. 1.1 并发与并行并发:指两个或多个事件在同一个时间段内发生. 并行:指两个或多个事件 ...
复盘鼎甲科技2020web开发工程师-笔试题（校招）
复盘鼎甲科技2020web开发工程师-笔试题(校招) 本试卷以W3C规范为准,JavaScript使用ES5标准,除特别说明外,不考虑各个浏览器之间差异. 一.多项选择题以下标签是行内元素(inli ...

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II

[leetcode/lintcode 题解] 一致性哈希 II · Consistent Hashing II的更多相关文章

随机推荐

热门专题