0、Redis目录结构


1)Redis介绍及部署在CentOS7上(一)

2)Redis指令与数据结构(二)

3)Redis客户端连接以及持久化数据(三)

4)Redis高可用之主从复制实践(四)

5)Redis高可用之哨兵模式Sentinel配置与启动(五)

6)Redis高可用之集群配置(六)

一、介绍


  上一篇我们已经介绍了Redis的主从复制,传送门:《Redis高可用之主从复制实践(四)》,想必大家对redis已经有一个概念了,那么问题来了,如果redis主从复制的master服务器挂掉了,那么整体redis就崩溃了,因为master无法进行写数据,导致slave中无法更新数据。

那么为了解决这个问题我们就需要有一种方案让redis宕机后可以自动进行故障转移,还好redis给我们提供一种高可用解决方案 Redis-Sentinel。Redis-sentinel本身也是一个独立运行的进程,它能监控多个master-slave集群,发现master宕机后能进行自动切换。Sentinel可以监视任意多个主服务器

以及主服务器属下的从服务器,并在被监视的主服务器下线时,自动执行故障转移操作。

  既然有这么好的解决方案,那么我们就来看看如何在我们的服务器上进行配置

二、Sentinel配置启动与故障转移


1、环境配置

第一:准备3台服务器,此处我的sentinel就直接放在原先的服务器上

主机说明 主机IP 端口 sentinel端口
master

192.168.250.132

7000

26379

slave  192.168.250.133 7001 26380
slave  

192.168.250.134

7002

26381

此处要说明一个问题,我这边的sentinel采用的是集群部署的方式,而不是单点,想必大家也知道单点会存在很多的问题,比如:

1):当sentinel进程宕掉后(sentinel本身也有单点问题,single-point-of-failure)整个集群系统将无法按照预期的方式运行;

2):如果只有一个sentinel进程,如果这个进程运行出错,或者是网络堵塞,那么将无法实现redis集群的主备切换(单点问题)。

如果有多个sentinel,redis的客户端可以随意地连接任意一个sentinel来获得关于redis集群中的信息;即使有一些sentinel进程宕掉了,依然可以进行redis集群的主备切换;

2、创建sentinel配置文件

进入 132 服务器的redis文件夹下,我们创建一个文件名为 sentinel-26379.conf 配置文件,文件内容如下:

port
daemonize yes
logfile "26379.log"
dir "./"
sentinel monitor mymaster 192.168.250.132
sentinel down-after-milliseconds mymaster
sentinel parallel-syncs mymaster
sentinel failover-timeout mymaster
sentinel auth-pass mymaster
bind 192.168.250.132 127.0.0.1

那么133与134服务器下的redis文件夹中我们也创建相同的sentinel 配置文件,但主要修改一下端口26380/26381以及bin绑定的数据。

看到这里大家因为会对上面的配置有些疑惑,那我分别介绍一下参数的含义:

像 port、daemonize、logfile、dir、bind 这些我就不介绍了,之前也介绍过了,这边重点介绍一下sentinel的配置

sentinel monitor <master-name> <ip> <redis-port> <quorum>
告诉sentinel去监听地址为ip:port的一个master,这里的master-name可以自定义,quorum是一个数字,指明当有多少个sentinel认为一个master失效时,master才算真正失效

sentinel auth
-pass <master-name> <password>
设置连接master和slave时的密码,注意的是sentinel不能分别为master和slave设置不同的密码,因此master和slave的密码应该设置相同。 sentinel down-after-milliseconds <master-name> <milliseconds>
这个配置项指定了需要多少失效时间,一个master才会被这个sentinel主观地认为是不可用的。 单位是毫秒,默认为30秒 sentinel parallel-syncs <master-name> <numslaves> 
这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为  来保证每次只有一个slave 处于不能处理命令请求的状态。

sentinel failover
-timeout <master-name> <milliseconds>
failover-timeout 可以用在以下这些方面:    
. 同一个sentinel对同一个master两次failover之间的间隔时间。  
. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。   
.当想要取消一个正在进行的failover所需要的时间。   
.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了。

配图如下:

这样子大家也能明白,那么接下来我们就要开始启动我们的sentinel啦,当然前提大家要先把redis主从复制开启。

sentinel 运行命令如下:

./src/redis-sentinel sentinel-.conf
./src/redis-sentinel sentinel-.conf
./src/redis-sentinel sentinel-.conf

运行完后我们再来看看sentinel-263779.conf的配置,发现配置文件被重写了,从内容可以看出有哪些slave和sentinel

内容已经配置完毕,现在我们进行一下故障转移吧,

3、故障转移

我们关闭master主节点,当然我演示的项目中master服务器是134,因为我之前有测试过,因此大家在操作的时候可以按照自己机器上的为主。

第一步:我们关闭134的redis,等待一会,我们再查看一下sentinel的日志。我们通过日志来分析一下自动故障转移的流程

=======================134master发现不能用
40325:X Jan ::09.920 # +sdown master mymaster 192.168.250.134 7002 =======================投票后有两个sentinel发现master不能用
:X Jan ::10.005 # +odown master mymaster 192.168.250.134 #quorum /2 =======================当前配置版本被更新
:X Jan ::10.005 # +new-epoch 2 =======================达到故障转移failover条件,正等待其他sentinel的选举
:X Jan ::10.005 # +try-failover master mymaster 192.168.250.134 7002 =======================进行投票选举slave服务器
:X Jan ::10.006 # +vote-for-leader 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.007 # f53245a5100693311aeaf090b903de8587b3743a voted for 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.008 # c8e067032a78eafcdca9636cb4d9777b492daea6 voted for 7985977d2db7df47bce251c06d50f77c3917d184
:X Jan ::10.077 # +elected-leader master mymaster 192.168.250.134
:X Jan ::10.077 # +failover-state-select-slave master mymaster 192.168.250.134 7002 =======================选择一个slave当选新的master
:X Jan ::10.178 # +selected-slave slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134 7002 =======================把选举出来的slave进行身份master切换
:X Jan ::10.178 * +failover-state-send-slaveof-noone slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134
:X Jan ::10.241 * +failover-state-wait-promotion slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134
:X Jan ::10.393 # +promoted-slave slave 192.168.250.132: 192.168.250.132 @ mymaster 192.168.250.134 7002 =======================把故障转移failover改变reconf-slaves
:X Jan ::10.393 # +failover-state-reconf-slaves master mymaster 192.168.250.134 7002 =======================sentinel发送slaveof命令把133重新同步132master
:X Jan ::10.448 * +slave-reconf-sent slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================重写rewrite master地址到sentinel配置文件中
:X Jan ::10.738 * +sentinel-address-switch master mymaster 192.168.250.134 ip 192.168.250.132 port for c8e067032a78eafcdca9636cb4d9777b492daea6
:X Jan ::10.907 * +sentinel-address-switch master mymaster 192.168.250.134 ip 192.168.250.138 port for c8e067032a78eafcdca9636cb4d9777b492daea6 =======================离开不可用的master
:X Jan ::11.135 # -odown master mymaster 192.168.250.134 7002 =======================slave被重新配置为另外一个master的slave,但数据还未发生
:X Jan ::11.407 * +slave-reconf-inprog slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================与master进行数据同步
:X Jan ::11.407 * +slave-reconf-done slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.134 7002 =======================故障转移完成
:X Jan ::11.508 # +failover-end master mymaster 192.168.250.134 7002 =======================master地址发生改变
:X Jan ::11.508 # +switch-master mymaster 192.168.250.134 192.168.250.132 7000 =======================检测slave并添加到slave列表
:X Jan ::11.508 * +slave slave 192.168.250.133: 192.168.250.133 @ mymaster 192.168.250.132
:X Jan ::11.508 * +slave slave 192.168.250.134: 192.168.250.134 @ mymaster 192.168.250.132
:X Jan ::12.475 * +sentinel-address-switch master mymaster 192.168.250.132 ip 192.168.250.132 port for c8e067032a78eafcdca9636cb4d9777b492daea

自此故障转移完成,我们查看一下132,现在132已经变成master了,并且 133和134变为了slave。

我们再来对比一下 sentinel-26379.conf的配置文件数据,发现已经修改了。自此failover完成。

三、总结


redis的高可用已经讲解了两大部分了,剩余的集群部署将是我们的最后的步骤,也是关键的。下一篇将会开启集群的配置。

如果上述有问题,欢迎大家指教。

参考文章:

《Redis及其Sentinel配置项详细说明》:https://blog.csdn.net/a1282379904/article/details/52335051

Redis 复制、Sentinel的搭建和原理说明》:https://www.cnblogs.com/zhoujinyi/p/5570024.html

Redis Sentinel高可用架构》:https://www.cnblogs.com/gomysql/p/5040847.html

asp.net core 交流群:787464275 欢迎加群交流
如果您认为这篇文章还不错或者有所收获,您可以点击右下角的【推荐】按钮精神支持,因为这种支持是我继续写作,分享的最大动力!

作者:LouieGuo
声明:原创博客请在转载时保留原文链接或者在文章开头加上本人博客地址,如发现错误,欢迎批评指正。凡是转载于本人的文章,不能设置打赏功能,如有特殊需求请与本人联系!

微信公众号:欢迎关注                                                 QQ技术交流群: 欢迎加群

                

Redis高可用之哨兵模式Sentinel配置与启动(五)的更多相关文章

  1. Redis 高可用之哨兵模式

    参考   : https://mp.weixin.qq.com/s/Z-PyNgiqYrm0ZYg0r6MVeQ 一.redis高可用解决方案 redis主从 优点:1.高可靠性,主从实时备份,有效解 ...

  2. 老司机带你玩转面试(4):Redis 高可用之哨兵模式

    前文回顾 建议前面文章没看过的同学先看下前面的文章: 「老司机带你玩转面试(1):缓存中间件 Redis 基础知识以及数据持久化」 「老司机带你玩转面试(2):Redis 过期策略以及缓存雪崩.击穿. ...

  3. Redis学习三:Redis高可用之哨兵模式

    申明 本文章首发自本人公众号:壹枝花算不算浪漫,如若转载请标明来源! 感兴趣的小伙伴可关注个人公众号:壹枝花算不算浪漫 22.jpg 前言 Redis 的 Sentinel 系统用于管理多个 Redi ...

  4. Redis 高可用之哨兵模式(二)

    上一篇实际操作过程中遇到两个问题 问题一:虽然运行了3个sentinel容器,实际上只有一个sentinel运行 问题出现的原因很简单,三个sentinel用的是同一个挂载配置文件,容器内部的更改直接 ...

  5. Redis高可用方案-哨兵与集群

    Redis高可用方案 一.名词解释   二.主从复制 Redis主从复制模式可以将主节点的数据同步给从节点,从而保障当主节点不可达的情况下,从节点可以作为 后备顶上来,并且可以保障数据尽量不丢失(主从 ...

  6. Redis高可用方案哨兵机制------ 配置文件sentinel.conf详解

    Redis的哨兵机制是官方推荐的一种高可用(HA)方案,我们在使用Redis的主从结构时,如果主节点挂掉,这时是不能自动进行主备切换和通知客户端主节点下线的. Redis-Sentinel机制主要用三 ...

  7. redis高可用(哨兵机制)

    redis哨兵机制:redis的哨兵系统用于管理多个reids服务器,该系统主要有三个作用: 监控:哨兵 会不断地检查你的主服务(Master)和从服务器(Slave)是否运作正常. 提醒:当被监控的 ...

  8. Redis高可用-主从,哨兵,集群

    主从复制 Master-Slave主从概念 同时运行多个redis服务端,其中一个作为主(master),其他的一个或多个作为从(slave),主从之间通过网络进行通讯,slave通过复制master ...

  9. 老司机带你玩转面试(3):Redis 高可用之主从模式

    前文回顾 建议前面文章没看过的同学先看下前面的文章: 「老司机带你玩转面试(1):缓存中间件 Redis 基础知识以及数据持久化」 「老司机带你玩转面试(2):Redis 过期策略以及缓存雪崩.击穿. ...

随机推荐

  1. Flink窗口介绍及应用

    Windows是Flink流计算的核心,本文将概括的介绍几种窗口的概念,重点只放在窗口的应用上. 本实验的数据采用自拟电影评分数据(userId, movieId, rating, timestamp ...

  2. spring cloud 微服务架构 简介

     Spring Cloud 1. Spring Cloud 简介 Spring Cloud是在Spring Boot的基础上构建的,用于简化分布式系统构建的工具集,为开发人员提供快速建立分布式系统中的 ...

  3. WebSockets Tutorial(教程一)WebSockets简介

    一.WebSockets简介 以字面意思来说,握手可以被定义为两个人抓住和握手右手,象征着问候,祝贺,同意或告别.在计算机科学中,握手是确保服务器与客户端同步的过程.握手是Web Socket协议的基 ...

  4. python 基础部分重点复习整理--从意识那天开始进阶--已结

    pythonic 风格编码 入门python好博客 进阶大纲 有趣的灵魂 老齐的教程 老齐还整理了很多精华 听说 fluent python + pro python 这两本书还不错! 元组三种遍历, ...

  5. 阿里云Linux服务器安装 nginx+mysql+php

    阿里云Linux服务器安装 nginx+mysql+php步骤1.登录服务器2.下载安装包3.将安装包上传到服务器的/home目录下 注:使用rz sz命令进行本地和服务器间的上传.下载,安装命令yu ...

  6. Spring Mvc + Maven + yuicompressor 使用 profile 来压缩 javascript ,css 文件; (十)

    profile相关知识点: 在开发项目时,设想有以下场景: 你的Maven项目存放在一个远程代码库中(比如github),该项目需要访问数据库,你有两台电脑,一台是Linux,一台是Mac OS X, ...

  7. 洛谷 P3916 【图的遍历】反向加边+dfs

    前言: 对于这类带环的图,一般记忆化搜索不能很好的对所有遍历的边进行更新取值.因为环上的点可以相互到达,所以他们的答案因当是同步更新的,而dfs一旦你回溯完环上某个点就不会在更新这个点的答案了,做不到 ...

  8. MongoDB 之 Array Object 的特殊操作 MongoDB - 6

    相比关系型数据库, Array [1,2,3,4,5] 和 Object { 'name':'DragonFire' } 是MongoDB 比较特殊的类型了 特殊在哪里呢?在他们的操作上又有什么需要注 ...

  9. C. NN and the Optical Illusion(几何)

    题目链接:http://codeforces.com/contest/1100/problem/C 题目大意:给你n和r,n指的是有n个圆围在里面的圆的外面,r指的是里面的圆的半径,然后让你求外面的圆 ...

  10. Windows命令-系统木马取样

    1.前言 工作中偶尔会遇到去现场提取木马样本回公司分析的情况.如果是生产环境下,不方便安装各类抓包.安全软件时.能用系统自带的命令去定位出木马程序相关的信息是最理想不过的状态. 2.Windows常用 ...