redis 5.0.5集群部署与服务器宕机故障模拟
背景
业务稳定性要求需要一套redis集群来保障
因此采用 redis cluster 集群
环境
| 名称 | ip地址 | cpu | 内存 | master端口 | slave端口 |
|---|---|---|---|---|---|
| redis-651 | 10.65.6.51 | 4c | 8G | 7001 | 7002 |
| redis-652 | 10.65.6.52 | 4c | 8G | 7001 | 7002 |
| redis-653 | 10.65.6.53 | 4c | 8G | 7001 | 7002 |
安装配置,以10.65.6.51 为例
#下载软件包
wget http://download.redis.io/releases/redis-5.0.5.tar.gz
#编译安装、
tar -zxvf redis-5.0.5.tar.gz
cd redis-5.0.5
make && make install
#修改必要的环境参数
echo 'never' > /sys/kernel/mm/transparent_hugepage/defrag
echo 'never' > /sys/kernel/mm/transparent_hugepage/enabled
#加入开机启动项:
vi /etc/rc.local
echo 'never' > /sys/kernel/mm/transparent_hugepage/defrag
echo 'never' > /sys/kernel/mm/transparent_hugepage/enabled
#修改内核参数
vi /etc/sysctl.conf
vm.overcommit_memory = 1
net.core.somaxconn= 1024
vm.max_map_count=655360
#修改连接数
ulimit -n 655350
#创建redis用户
useradd -d /exporter/redis -m redis
#在redis用户根目录创建redis_cluster
su - redis
mkdir redis_cluster
mkdir logs
#在 redis_cluster 目录下,创建名为7001、7002的目录,并将 redis.conf 拷贝到这二个目录中,提前准备好 redis 配置文件
cd redis_cluster
mkdir 7001 7002
#配置 7001 redis.conf 文件并启动实例
cd 7001
#cat redis.conf
bind 0.0.0.0
protected-mode yes
port 7001
tcp-backlog 511
timeout 0
tcp-keepalive 300
daemonize no
supervised no
pidfile /exporter/redis/redis_7001.pid
loglevel notice
logfile "/exporter/redis/logs/redis-7001.log"
databases 16
save 900 1
save 300 10
save 60 10000
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump-7001.rdb
dir ./
slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5
repl-disable-tcp-nodelay no
slave-priority 100
maxmemory 2147483648
appendonly yes
appendfilename "appendonly-7001.aof"
appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000
cluster-enabled yes
cluster-config-file nodes-7001.conf
cluster-node-timeout 15000
slowlog-log-slower-than 10000
slowlog-max-len 128
latency-monitor-threshold 0
notify-keyspace-events ""
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
list-max-ziplist-size -2
list-compress-depth 0
set-max-intset-entries 512
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
hll-sparse-max-bytes 3000
activerehashing yes
client-output-buffer-limit normal 0 0 0
client-output-buffer-limit slave 256mb 64mb 60
client-output-buffer-limit pubsub 32mb 8mb 60
hz 10
aof-rewrite-incremental-fsync yes
masterauth m2i3s5
requirepass m2i3s5
# cat start.sh
redis-server ./redis.conf &
#启动 7001 redis 实例
su - redis
bash start.sh
#配置 7002 redis.conf 文件并启动实例
cd /exporter/redis/redis_cluster/7002
$ cat redis.conf
bind 0.0.0.0
protected-mode yes
port 7002
tcp-backlog 511
timeout 0
tcp-keepalive 300
daemonize no
supervised no
pidfile /exporter/redis/redis_7002.pid
loglevel notice
logfile "/exporter/redis/logs/redis-7002.log"
databases 16
save 900 1
save 300 10
save 60 10000
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump-7002.rdb
dir ./
slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5
repl-disable-tcp-nodelay no
slave-priority 100
maxmemory 2147483648
appendonly yes
appendfilename "appendonly-7002.aof"
appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000
cluster-enabled yes
cluster-config-file nodes-7002.conf
cluster-node-timeout 15000
slowlog-log-slower-than 10000
slowlog-max-len 128
latency-monitor-threshold 0
notify-keyspace-events ""
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
list-max-ziplist-size -2
list-compress-depth 0
set-max-intset-entries 512
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
hll-sparse-max-bytes 3000
activerehashing yes
client-output-buffer-limit normal 0 0 0
client-output-buffer-limit slave 256mb 64mb 60
client-output-buffer-limit pubsub 32mb 8mb 60
hz 10
aof-rewrite-incremental-fsync yes
masterauth m2i3s5
requirepass m2i3s5
# cat start.sh
redis-server ./redis.conf &
#启动 7002 redis 实例
su - redis
bash start.sh
#查看节点实例端口是否启动,查看已经启动

另外两个服务器节点 redis实例配置并启动
按照10.65.6.51 实例配置,依次启动redis 实例
创建集群
su - redis
redis-cli -a m2i3s5 --cluster create 10.65.6.51:7001 10.65.6.51:7002 10.65.6.52:7001 10.65.6.52:7002 10.65.6.53:7001 10.65.6.53:7002 --cluster-replicas 1
输入 yes 自动完成集群创建
#参数
–cluster-replicas 1
最后面的数字是指每个master带有多少个slave从结点。
这里最后的数是1,那就是每个master节点有一个slave从节点。如果最后的数字是2,那么代表每个master对应2个slave从结点。
-a 指定密码
# 查看集群信息
$ redis-cli -c -p 7002 -h 10.65.6.53 -a m2i3sc5
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
10.65.6.53:7002> CLUSTER nodes
5a3ac40d4fb508294581d54a5f1c78482e7510bc 10.65.6.51:7001@17001 master - 0 1667381997109 1 connected 0-5460
feec77be74afc3822711614ae9108f5b77f3fa11 10.65.6.53:7001@17001 master - 0 1667381995099 10 connected 10923-16383
3988c010767e71c4b86941a709d5ae7c96d2a662 10.65.6.53:7002@17002 myself,slave 5a3ac40d4fb508294581d54a5f1c78482e7510bc 0 1667381985000 0 connected
3299250eeb002bd9a24a7f69900ab6795a908c67 10.65.6.52:7002@17002 slave feec77be74afc3822711614ae9108f5b77f3fa11 0 1667381996103 10 connected
26a308f4be77175789d8d400aec57ae16548122b 10.65.6.51:7002@17002 slave 218f90ba77b311c205ca7c96daa64a6f27aa363c 0 1667381994094 9 connected
218f90ba77b311c205ca7c96daa64a6f27aa363c 10.65.6.52:7001@17001 master - 0 1667381993091 9 connected 5461-10922
#集群会自动创建主从关系
master slave
10.65.6.51:7001 10.65.6.53:7002
10.65.6.52:7001 10.65.6.51:7002
10.65.6.53:7001 10.65.6.52:7002
调整集群内存
# redis-cli -c -p 7001 -h 10.65.6.53 -a m2i3s5
10.65.6.53:7001> info memory
#maxmemory_human:2.00G,将集群内存调整至 3G,6个 redis实例节点都要配置,并且实时生效,生效好最好写进 redis.conf,保证重启后永久生效
# redis-cli -c -p 7001 -h 10.65.6.53 -a m2i3s5
10.65.6.53:7001> info memory
10.65.6.53:7002> config set maxmemory 3221225472
OK
10.65.6.53:7001> info memory
模拟服务器宕机,关机其中任意一个节点,查看其主从关系,并重新安装一台新的服务器,加入redis集群,以 10.65.6.53 关机模拟故障
#查看redis集群,执行 CLUSTER nodes 发现10.65.6.53 上7001、7002 实例已处于 fail 状态,但是10.65.6.53:7001 的从节点10.65.6.52:7002 已经自动升级为master
10.65.6.51:7002> CLUSTER nodes
#查看槽位分配,10.65.6.52:7002 已经接替 10.65.6.53:7001 槽位
10.65.6.51:7002> CLUSTER SLOTS
#重新创建一台虚拟机 10.65.6.54,启动后修改ip,将ip 修改为原节点ip 10.65.6.53,并完成节点初始化配置,启动两个端口实例。
#查看节点 id
10.65.6.51:7002> CLUSTER nodes
#删除故障节点,此处经验证需要在存活的 4个实例中分别执行
10.65.6.51:7002>cluster forget b6e5b93d9f2e923f64b7bf67d8dffc37c4b45500
10.65.6.51:7002>CLUSTER forget d595f2a9cc43384642ed92d8f4384c7dee6ffdba
#添加新节点
redis-cli -a m2i3s5 --cluster add-node 10.65.6.53:7001 (添加的节点) 10.65.6.51:7001 (集群任意节点)
redis-cli -a m2i3s5 --cluster add-node 10.65.6.53:7002 (添加的节点) 10.65.6.51:7001 (集群任意节点)
#查看节点,发现新添加的两个 redis实例都是master,需要手动分配主从关系
10.65.6.51:7002> CLUSTER nodes
#将10.65.6.53:7002 修改为 10.65.6.51:7001 的从节点
10.65.6.53:7002> CLUSTER nodes
10.65.6.53:7002> cluster replicate 5a3ac40d4fb508294581d54a5f1c78482e7510bc(主节点 10.65.6.51:7001 id)
10.65.6.53:7002> CLUSTER nodes
#将10.65.6.53:7001 修改为10.65.6.52:7002 的从节点
10.65.6.53:7001> CLUSTER nodes
10.65.6.53:7001> cluster replicate 3299250eeb002bd9a24a7f69900ab6795a908c67 (主节点 10.65.6.51:7001 id)
#在 10.65.6.53:7001 从节点上执行 CLUSTER FAILOVER 更换主从关系
10.65.6.53:7001> CLUSTER FAILOVER
#最终保证主从关系
10.65.6.51:7001 10.65.6.53:7002
10.65.6.52:7001 10.65.6.51:7002
10.65.6.53:7001 10.65.6.52:7002
#查看原有key,保证了数据可用
至此,redis集群搭建完成,模拟服务器宕机演练完成,保证数据不丢失!
redis 5.0.5集群部署与服务器宕机故障模拟的更多相关文章
- redis 3.0的集群部署
转载请注明出处:http://hot66hot.iteye.com/admin/blogs/2050676 最近研究redis-cluster,正好搭建了一个环境,遇到了很多坑,系统的总结下,等到re ...
- (转)redis 3.0的集群部署
一:关于redis cluster 1:redis cluster的现状 reids-cluster计划在redis3.0中推出,可以看作者antirez的声明:http://antirez.com/ ...
- Redis 5.0.3集群部署
参考文章 https://blog.csdn.net/yyTomson/article/details/85783753 https://www.cnblogs.com/zy-303/p/102731 ...
- Redis 中常见的集群部署方案
Redis 的高可用集群 前言 几种常用的集群方案 主从集群模式 全量同步 增量同步 哨兵机制 什么是哨兵机制 如何保证选主的准确性 如何选主 选举主节点的规则 哨兵进行主节点切换 切片集群 Redi ...
- Redis 3.0 Cluster集群配置
Redis 3.0 Cluster集群配置 安装环境依赖 安装gcc:yum install gcc 安装zlib:yum install zib 安装ruby:yum install ruby 安装 ...
- Redis 5.0.5集群搭建
Redis 5.0.5集群搭建 一.概述 Redis3.0版本之后支持Cluster. 1.1.redis cluster的现状 目前redis支持的cluster特性: 1):节点自动发现 2):s ...
- hbase-2.0.4集群部署
hbase-2.0.4集群部署 1. 集群节点规划: rzx1 HMaster,HRegionServer rzx2 HRegionServer rzx3 HRegionServer 前提:搭建好ha ...
- 配置redis 4.0.11 集群
配置redis 4.0.11 集群 准备redis 软件和redis配置文件 启动Redis服务 /data/soft/redis/src/redis-check-aof --fix /log/red ...
- 假如Kafka集群中一个broker宕机无法恢复,应该如何处理?
假如Kafka集群中一个broker宕机无法恢复, 应该如何处理? 今天面试时遇到这个问题, 网上资料说添加新的broker, 是不会自动同步旧数据的. 笨办法 环境介绍 三个broker的集群, z ...
- redis3.0.5集群部署安装详细步骤
Redis集群部署文档(centos6系统) (要让集群正常工作至少需要3个主节点,在这里我们要创建6个redis节点,其中三个为主节点,三个为从节点,对应的redis节点的ip和端口对应关系如下) ...
随机推荐
- 【深入浅出Sentinel原理及实战】「基础实战专题」零基础实现服务流量控制实战开发指南(2)
你若要喜爱你自己的价值,你就得给世界创造价值. Sentinel的组成部分 Sentinel 主要由以下两个部分组成. Sentinel核心库(Java客户端) :Sentinel的核心库不依赖任何框 ...
- python模块(module)
目录 模块化(module)程序设计理念 模块和包概念的进化史 标准库模块(standard library) 为什么需要模块化编程 模块化编程的流 模块的 API 和功能描述要点 模块的创建和测试代 ...
- appium基本使用(Android)
一.环境搭建 详情可见:https://www.cnblogs.com/lihongtaoya/p/16971096.html 二.元素定位 详情可见:https://www.cnblogs.com/ ...
- Google Cloud Platform | 使用 Terraform 的分层防火墙策略自动化
[本文由Cloud Ace整理发布,更多内容请访问Cloud Ace 官网] 防火墙规则是 Google Cloud 中网络安全的重要组成部分.Google Cloud 中的防火墙大致可分为两种类型: ...
- 重学c#系列—— IO流[三十四]
前言 简单介绍一下io流. 以前写过两篇,里面是java 语言写的,简单介绍了一下io流,这里是对io流的整理. https://www.cnblogs.com/aoximin/p/12007925. ...
- 11月15日内容总结——软件开发架构、网络编程介绍和OSI七层协议介绍
目录 一.软件开发架构 1.什么是软件开发架构 2.软件开发架构 架构方式一:c/s架构 架构方式二:b/s架构 架构优劣势 二.架构总结 三.网络编程前戏 1.什么是网络编程 2.学习网络编程的目的 ...
- KStudio-Java程序连接KingbaseES数据库异常
错误信息: --KStudio客户端工具错误信息 The conncetion attempt failed.Reason:connect time out --Java应用程序控制台日志 Cause ...
- 图书管理员(NOIP 2017 PJT2)
0.题目 1.输入 输入 n,q: 输入图书,存入vector string a[20]数组,a[i][j],其中i表示图书编号的位数 2.查询操作 2.1 每输入一个读者需求 存入 int t; s ...
- Spring03-IOC-循环依赖的实现(Debug查看spring解决循环依赖的过程)
1 什么是循环依赖 如下,有类A和B,A中有一个类型为B的属性b,B中有一个类型为A的属性a,A和B相互依赖 public class A { private B b; public B getB() ...
- 真正“搞”懂HTTPS协议之目录和一点啰嗦
说实话,我写完这个系列之后,或者说抄完这个系列之后,唯一的脑海里浮现的词叫做"惭愧".如果你读过罗剑锋老师的<透视HTTP协议>的话,就能察觉到本系列越往后面的部分,几 ...