方案概述:

对于ycache-client,如下图,在一致性hash环上的每个节点都有一个备用的节点。正常情况下slave节点不参与key的分配(冷备)。只有当master挂了,ycache client读取/监听了zk上的slaveof节点,从而得知那些cache实例是slave状态的,把slave实例排除掉。数据变更时,如果变更的redis实例当前自己在使用,就重新初始化这个pool的所有链接。
当master发生故障时,master、slave的切换时在yagent完成的。yagent定时将redis实例对应的master/slave关系写到zk的slaveof节点上。然后slave上会每5秒检查一次master的状态。如果master没有响应,就将slave升级为master。
yconsole负责master/slave关系的管理,可以将某个redis服务设置为slave状态,查看状态等。
  


实现说明:

  1. redis版本升级为3.0.1(也可以使用2.8.*的版本,但需要确保主、备版本是相同的)
    1. 打包新的redis rpm包
      1. redis使用开源的3.0.1的源码包
      2. 将https://github.com/zwChan/remirepo/tree/master/redis 拷贝到rpmbuild的source目录(/root/rpmbuild/SOURCES/),然后执行rpmbuild -bb redis.spec.
      3. 更新缺省的redis配置文件,支持aof(?)
    2. 检查命令的兼容情况
  2. yagent适配
    1. 读取自己管理的slave,定时更新一次这个信息(缺省10s,可配置)
    2. 定时检查一下slave对应的master是否正常,如果不正常,将自己设置为master,将原来的master设置为slave(缺省间隔为1s,连续检查5次失败后才算失败,所以延时5秒)
    3. 定时检查当前的master实例是否在zk上被配置为slave,如果是,将它转换为slave状态(5秒间隔)
    4. 每次一个redis实例重启后,如果它有slave且正常,都将正在起的实例变更为slave,将它原来的slave变更为master。这样做是为了避免redis实例快速重启导致数据丢失。详细的问题见: http://redis.io/topics/replication  “Safety of replication when master has persistence turned off”
    5. 如果redis实例的主备状态和zk上的状态不一样,修改为与zk上的一样。(5秒间隔)
  3. yconsole适配
    1. 添加slaveof命令,配置和删除redis之间的主从关系;yconsole { slaveof } slave master
    2. 添加slaves命令,显示主从关系;同时检查zk上的主从关系是否与redis真实的主从关系一致。
    3. 主从关系发生变化时,通过命令行slaveof动态通知redis做出对应改变;
    4. add命令计算容量时不计算slave
    5. add/app/mod命令将slave也自动写到cache id的内容里
    6. list命令显示主从关系
  4. ycache-client适配
    1. slaveof目录的子节点增加和删除时,要进行重新初始化pool的处理
    2. 初始化pool时,将slaveof下的slave状态的实例去除
    3. 当slave的master变化时,不需要处理
    4. 每个pool只初始化一个zkproxy
  5. 限制:
    1. 每个master最多只能有一个slave,slave不能作为master;

使用方法:

  1. ycache-client:此功能对ycache-client使用者透明,仅须升级为2.2.0及以上版本的;
  2. yconsole:添加了slaves和slaveof命令,请查看 yconsole help命令获取命令格式。
    1. slaves: 查看slave和master对应的关系,后面的状态“ok”标识现在zk上的主备关系与redis本身主备关系的是一致的。
    2. slaveof:添加或删除slave/master关系(master参数为‘none’时删除关系)

      刚配置后的几秒内,zk状态和redis状态可能不一致。等几秒后状态就一致了。
    3. 添加cache id时,如果一个redis实例已经被指定为slave,它所占用的资源不被计算到命令行指定的资源中;但如果分配后才配置slave/master关系的,cache id的容量会变少(因为slave是不参与使用)

      将master添加到test中,它的slave会自动加到test中。但是,如果你单独将slave添加到test中,不会带着master加到test。 这是一种错误的配置,slave不应该直接被使用(尽管没有被禁止)
  3. yagent:升级版本大于等于‘2015-06-02';升级redis版本为2.8.*。 使用方法不变。redis新的rpm包在svn上。

问题与改进

当前有性能问题: 
  1. 所有的redis 的client都监听slaveof目录,很容易造成惊群问题;
  2. 老版本的client不能在主从环境的redis上用。所以要确保client升级后,才能用yconsole设置主从关系。

这两个问题是可以避免的,只要在cache id的内容中不记录从节点的信息即可。/redis/pools/cache-id的内容仅是master的节点,/redis/slaveof下记录slave对应的slave->master关系。每次主从关系变化时,都要确保/redis/pools/cache-id下的内容都是master,不包含slave(而且cache实例排列顺序也不能改变,之前的设计主要是考虑到这个因素)。这样就能够使得老版本的client也能使用主从关系了。同时,由于每个pool只依然仅监听自己的cache-id,不会会有惊群的现象。yagent和yconsole要确保上面提到的关系转换正确。

当然其他方面也要相应修改,但修改后的架构更为清晰,当前架构反而不是很好。当前yhd使用redis的不多,而且主从很少变化,所以惊群问题还不明显。





ycache中redis主备功能设计及使用说明的更多相关文章

  1. 搭建和测试 Redis 主备和集群

    本文章只是自我学习用,不适宜转载. 1. Redis主备集群 1.1 搭建步骤 机器:海航云虚机(2核4GB内存),使用 Centos 7.2 64bit 操作系统,IP 分别是 192.168.10 ...

  2. 如何在DCS管理控制台将两个Redis主备实例建立全球灾备。

    华为云分布式缓存服务DCS,具有强大的功能,现在小编教大家如何在DCS管理控制台将两个Redis主备实例建立全球灾备. 建立全球灾备,会对主实例和备实例进行升级,实例进程会重启,连接会中断.同时备实例 ...

  3. 阿里云ECS部署Redis主备哨兵集群遇到的问题

    一.部署 详细部署步骤:https://blog.csdn.net/lihongtai/article/details/82826809 Redis5.0版本需要注意的参数配置:https://www ...

  4. Redis主备自动切换

    Sentinel(哨兵)是用于监控redis集群中Master状态的工具. 一.Sentinel作用  1.Master状态检测   2.如果Master异常,则会进行Master-Slave切换,将 ...

  5. 分布式Redis主备复制

    当数据落在不同节点上时,如何保证数据节点之间的一致性是非常关键的 Redis采用主备复制的方式保证一致性,所有节点中,只有一个节点为主节点(master),它对外提供写服务,然后异步的将数据复制到其他 ...

  6. Redis - Keepalived + redis 主备热备切换

    1. 热备方案 硬件:server两台,分别用于master-redis及slave-redis 软件:redis.keepalived 实现目标: 由keepalived对外提供虚拟IP(VIP)进 ...

  7. Redis主备复制

    Redis 支持 Master-Slave(主从)模式,Redis Server 可以设置为另一个 Redis Server 的主机(从机),从机定期从主机拿数据.特殊的,一个从机同样可以设置为一个 ...

  8. haproxy配置监控redis主备切换(转)

    环境前提:     redis sentinel配置,三台主机,且配置运行良好        配置文件中添加: frontend ft_redis  bind 0.0.0.0:6379 name re ...

  9. 请不要用SECONDS_BEHIND_MASTER来衡量MYSQL主备的延迟时间【转】

    本文来自:http://www.woqutech.com/?p=1116 MySQL 本身通过 show slave status 提供了 Seconds_Behind_Master ,用于衡量主备之 ...

随机推荐

  1. MUI 支付案例(支付宝/微信)

    首先说明一下,本文借鉴了多位博主的文章,所以会看到很多一样的代码. 写这篇博客主要目的是为了便于后期查看(不好之处,敬请留言吐槽),案例经本人测试,是可以使用的. 先上效果图 前端HTML代码: &l ...

  2. 少勇 #import和@class的区别

    #import与@class的区别1.import会包含这个类的所有信息,包括实体变量和方法,而@class只是告诉编译器,其后面声明的名称是类的名称,至于这些类是如何定义的,暂时不用考虑,后面会再告 ...

  3. 微信小程序文章收录

    基础篇 03-04 微信登入小程序与后端实现 - 小猿取经 - 博客园 我做的小程序 - 小y - 博客园 小程序二维码和小程序带参数二维码生成 - Likwo - 博客园 accesstoken 微 ...

  4. ZOJ 4097 Rescue the Princess 边双缩点+LCA

    给你一个图和三个点U,V,W  问你是否存在从U到V和从U到W的两条边不相交路径 先边双缩点 再每个连通分量搞LCA 最后LCA判 #include<bits/stdc++.h> usin ...

  5. (五)zabbix微信报警

    1.注册微信企业号 1)注册微信企业号 https://work.weixin.qq.com 2)通讯录添加用户 3)记住部门id 4)创建应用 5)点击刚创建的应用,记住Agentld和secret ...

  6. Linux (Deppin ,Ubuntu )开发环境配置,VUE & dotnetcore 解决 yarn 找不到问题

    新装系统设置 清华镜像: https://mirror.tuna.tsinghua.edu.cn/help/ubuntu/ 网易镜像: http://mirrors.163.com/.help/ubu ...

  7. spark为什么比hadoop的mr要快?

    1.前言 Spark是基于内存的计算,而Hadoop是基于磁盘的计算:Spark是一种内存计算技术. 但是事实上,不光Spark是内存计算,Hadoop其实也是内存计算. Spark和Hadoop的根 ...

  8. BZOJ 2049: [Sdoi2008]Cave 洞穴勘测 (LCT维护连通性)

    直接把x设为根,然后查询y所在联通块的根是不是x就行了. CODE #include <cstdio> #include <cstring> #include <algo ...

  9. kafka什么时候会丢消息(转)

    因为在具体开发中某些环节考虑使用kafka却担心有消息丢失的风险,本周结合项目对kafka的消息可靠性做了一下调研和总结: 首先明确一下丢消息的定义.kafka集群中的部分或全部broker挂了,导致 ...

  10. log4j.properties通用配置

    一.Log4j的配置文件分类Log4j支持两种配置文件格式,一种是XML格式的文件,一种是properties(key=value)文件,其中properties格式的配置文件最为常用,其有一个固定的 ...