网上参考到别人博客说,redis容灾切换的时候,有几率出现脑裂的情况. 什么是脑裂: sentinel判断master宕机,切换slave为新master的过程中,业务数据还在持续往原master写入数据,因为此时新master还是slave,没有写入权限,就会出现数丢失的情况. 解决方案: 看了很多文章,都是说对redis的配置新增两个设置. 1 min-slaves-to-write 1 2 min-slaves-max-lag 10 参数解释: 要求至少有1个slave,数据复制和同步延迟…
上周遇到个灵异事件,实验室有两套环境来搭建redis集群和哨兵,分别是: 第一套环境IP:67(master) 65(salve) 66(salve)第二套环境IP:115(master) 116(salve) 117(salve) 第一天把哨兵搭建好后,两套环境的主从关系都是一主两从,但是到了第二天,莫名其妙的,第二天环境的3个redis都挂载到第一套环境下了,都成了67的salve,如图所示: 1 127.0.0.1:6379> info replication 2 3 role:maste…
Redis容灾部署(哨兵Sentinel) 哨兵的作用 1. 监控:监控主从是否正常2. 通知:出现问题时,可以通知相关人员3. 故障迁移:自动主从切换4. 统一的配置管理:连接者询问sentinel取得主从的地址 Raft分布式算法 1. 主要用途:用于分布式系统,系统容错,以及选出领头羊2. 作者:Diego Ongaro,毕业于哈佛3. 目前用到这个算法的项目有: a. CoreOS : 见下面 b. ectd : a distributed, consistent shared conf…
版权声明:转载请注明出处 http://blog.csdn.net/irean_lau. https://blog.csdn.net/Irean_Lau/article/details/51360277 基本的redis的容灾策略为: 1 采用master-slave方式 2 为了得到好的读写性能,master不做任何的持久化 3 slave同时开启Snapshot和AOF来进行持久化,保证数据的安全性 4 当master挂掉后,修改slave为master 5 恢复原master数据,修改原先…
环境: Primary    节点:node1Secondary  节点:node2 DRBD产生脑裂的原因:    (1. 采用HA环境的时候自动切换导致脑裂;    (2. 人为操作或配置失误,导致产生的脑裂:    (3. 经验有限,惭愧的很,只碰到以上2中产生脑裂的原因. 如何判断脑裂行为?    (1. 其中一个节点的连接状态始终为 StandAlone    (2. 其中一个节点的连接状态始终为 WFConnection 1.通过cat /proc/drbd 命令查看,Seconda…
本文档介绍了glusterfs中可用于监视复制卷状态的heal info命令以及解决脑裂的方法 一. 概念解析 常见术语 名称 解释 Brick GlusterFS 的基本存储单元,由可信存储池中服务器上对外输出的目录表示.存储目录的格式由服务器和目录的绝对路径构成 SERVER:EXPORT Volume 一个卷,在逻辑上由N个bricks组成 Fuse Unix-like OS上的可动态加载的模块,允许用户不用修改内核即可创建自己的文件系统 Glusterd Gluster manageme…
redis主从集群搭建及容灾部署(哨兵sentinel) Redis也用了一段时间了,记录一下相关集群搭建及配置详解,方便后续使用查阅. 提纲 l  Redis安装 l  整体架构 l  Redis主从结构搭建 l  Redis容灾部署(哨兵sentinel) l  Redis常见问题 Redis安装 发行版:CentOS-6.6 64bit 内核:2.6.32-504.el6.x86_64 CPU:intel-i7 3.6G 内存:2G 下载redis,选择合适的版本 [root@rocket…
Redis也用了一段时间了,记录一下相关集群搭建及配置详解,方便后续使用查阅. 提纲 Redis安装 整体架构 Redis主从结构搭建 Redis容灾部署(哨兵sentinel) Redis常见问题 Redis安装 发行版:CentOS-6.6 64bit 内核:2.6.32-504.el6.x86_64 CPU:intel-i7 3.6G 内存:2G 下载redis,选择合适的版本 [root@rocket software]# wget http://download.redis.io/re…
本文由  网易云发布. 数字化转型浪潮之下,采用云计算服务提升业务敏捷性.降低运维成本,成为了传统企业的优选方案.网易云资深解决方案架构师张亮通过某物流企业客户的实际案例,分享了传统业务系统在云上的架构设计如何满足数据高可靠.业务高可用的需求,并总结了传统业务上云的常见问题和解决方案. 物流企业业务系统上云需求 对于物流企业来说,内部沟通.供应链协同对优化供应链效率提升核心竞争力非常重要.作为行业翘楚,该物流企业客户建立了一个企业级移动办公平台,该平台集成了即时通讯(IM).企业内部的ERP.O…
容灾全景图: 按照距离划分:分为本地容灾 同城容灾 异地容灾  本地容灾包括本地高可用和本地主备.(本数据中心的两机房.机柜) 本地高可用这个方案为了保持业务的连续性,从两个层面来考虑: ①一个是从主机.服务器这个层面考虑,假如这个服务器上的虚拟机或者业务挂了,可以自动的从其他服务器上把它拉活,以此来保证业务的连续性,主要是通过集群HA.DRS.DPM的这些特性. ②另一个就是从存储层面来考虑,使用的Hypermetro特性/ HyperMirror+SmartVirtualization(异构…