一、慢查询

因为 Redis 是单线程的,大量的慢查询可能会导致 redis-server 阻塞,可以通过 slowlog get n 获取慢日志,查看详情情况。

二、bigkey 大对象

bigkey 大对象可能会导致的问题包括:

  • 内存空间不均匀(平衡),例如在 Redis Cluster 中,bigkey 会造成节点的内存空间使用不均匀。
  • 超时阻塞:由于Redis 单线程的特性,操作 bigkey 比较耗时,也就意味着阻塞 Redis 的可能性增大。
  • 网络阻塞:每次获取 bigkey 产生的网络流量较大,假设一个 bigkey 为 1MB,每次访问量为 1000,那么每秒产生 1000MB 的流量,对于普通的千兆网卡(按照字节算是128MB/s)的服务器简直是灭顶之灾。

bigkey 的存在并不是完全致命的,如果这个 bigkey 存在但是几乎不被访问,那么只有内存空间不均匀的问题存在,相对于另外两个问题没有那么重要紧急,但是如果 bigkey 是一个热点key(频繁访问),那么其带来的危害不可想象,所以在实际开发和运维时一定要密切关注 bigkey 的存在。

可以通过 redis-cli -h {ip} -p {port} bigkeys 发现大对象。

三、swap

因为 Redis 的数据放在内存中,所以存放数据量的多少取决于内存的多少。

如果一个 Redis 实例的内存使用率超过可用最大内存(used_memory > 可用最大内存),那么操作系统开始进行内存和 swap 空间交换,把内存中旧的或不再使用的内容写入硬盘上(硬盘上的这块空间叫 Swap 分区),以便腾出新的物理内存给新页使用。

在硬盘上进行读写操作要比内存上慢了近5个数量级 —— 内存是 0.1μs 单位、硬盘是 10ms。如果 Redis 进程上发生内存交换,那么 Redis 和 依赖 Redis 上数据的应用会受到严重的性能影响。

查看 used_memory 指标可知道 Redis 正在使用的内存情况,识别 Redis 内存交换的检查方法:

  1. 识别 redis 进程号

redis-cli info server | grep process_id

  1. 根据进程号查询内存交换信息

cat /proc/{process_id}/smaps | grep Swap

如果交换量都是 0KB 或者个别 4KB,是正常现象。

预防内存交换:

  1. 保证机器充足的可用内存;
  2. 确保所有 redis 示例设置最大可用内存(maxmemory),防止极端情况下 redis 内存不可控的增长;
  3. 降低系统使用 swap 优先级,如 echo 10>/proc/sys/vm/swappiness。

四、fork 子进程

在 RDB 生成和 AOF 重写时,会 fork 一个子进程完成持久化工作,当 fork 操作执行太过耗时也会造成阻塞,阻塞原因是该操作会复制父进程的空间内存表,即 fork 操作耗时跟内存量(数据集)关系较大。

fork 操作是重量级操作,会复制父进程的空间内存表(理论上需要复制与父进程同样的内存,但是 linux 有写时复制机制,父子进程贡献相同的物理内存页,实际会小很多,10G 大概只需要 20MB)。

fork 耗时应该在 20ms/GB;应该严格控制每个实例可使用的最大内存 10GB 以内(复制空间内存表);降低 fork 操作执行频率,适当放宽 AOF 重写触发时机。

使用 info stats 命令获取 lastest_fork_usec 指标,表示 redis 最近一次 fork 操作耗时。

五、AOF 刷盘阻塞

开启 AOF,文件刷盘一般每秒一次,硬盘压力过大时,fsync 需要等待写入完成。

查看 redis 日志或 info persistence 统计中的 aof_delayed_fsync 指标。

六、Redis 输入缓冲区可能导致的阻塞

输入缓冲区:redis 为每个客户端分配了输入缓冲区,其会将客户端发送命令临时保存,然后取出来执行。 qbuf 表示总容量(0 表示没有分配查询缓冲区),qbuf-free 表示剩余容量(0 表示没有剩余空间);大小不能超过 1G,当大小超过 1G 时会将客户端自动关闭,输入缓冲区不受 maxmemory 限制。

当大量的 key 进入输入缓冲区且无法被消费时,即可造成 redis 阻塞;通过 client list 命令可定位发生阻塞的客户端;通过 info clients 命令的 blocked_clients 参数可以查看到当前阻塞的命令。

七、Redis 输出缓冲区可能导致的阻塞

输出缓冲区(client output buffer):是 redis-server 端实现的一个读取缓冲区,redis-server 在接收到客户端的请求后,把获取结果写入到 client buffer 中,而不是直接发送给客户端。从而可以继续处理客户端的其他请求,这样异步处理方式使 redis-server 不会因为网络原因阻塞其他请求的处理。

redis client buffer 的配置参数为 "client-output-buffer-limit",默认值为:

127.0.0.1:6379> CONFIG GET "*output*"
1) "client-output-buffer-limit"
2) "normal 0 0 0 slave 0 0 0 pubsub 0 0 0"
  • class :客户端种类,normal、slave、pubsub

    • normal:普通的客户端
    • slave: 从库的复制客户端
    • pub/sub: 发布与订阅的客户端
  • hard limit: 缓冲区大小的硬性限制。
  • soft limit: 缓冲去大小的软性限制。
  • soft seconds: 缓冲区大小达到了(超过)soft limit 值的持续时间。

client-output-buffer-limit 参数限制分配的缓冲区的大小,防止内存无节制的分配。参数的默认值都为 0,意思是不做任何限制。

redis server 触发保护机制主要有两种情况:

  1. client buffer 的大小达到了 soft limit 并持续了 soft seconds 时间,将立即断开和客户端的连接。
  2. client buffer 的大小达到了 hard limit,server 也会立即断开和客户端的连接。

八、网络问题

1. 连接拒绝

  • 网络闪断:一般在网络割接或带宽耗尽的情况;
  • redis 连接拒绝:连接数大于 maxclients 时拒绝新的连接进入,可以关注 info stats 的 rejected_connections 指标;
  • 连接溢出:
    • 进程限制:进程可打开最大文件数控制 —— ulimit -n,通常 1024,大量连接的 redis 需要增大该值;
    • backlog 队列溢出:系统对于特定端口 tcp 连接使用 backlog 队列保存,redis 默认 511,系统 backlog 默认 128,线上可使用 cron 定时执行 netstat -s | grep overflowed 统计;

2. 网络延迟

测量机器之间的网络延迟

redis-cli -h {ip} -p {port} –latency

redis-cli -h {ip} -p {port} –latency-history 默认15秒完成一行统计,-i控制采样时间

redis-cli -h {ip} -p {port} –latency-dist 统计图展示,每1秒采样一次

Redis学习五(Redis 阻塞的原因及其排查方向).的更多相关文章

  1. redis学习五,redis集群搭建及添加主从节点

    redis集群 java架构师项目实战,高并发集群分布式,大数据高可用,视频教程 在redis3.0之前,出现了sentinel工具来监控各个Master的状态(可以看上一篇博客).如果Master异 ...

  2. redis学习五 集群配置

    redis集群配置 0,整体概述      整体来说就是:      1,安装redis      2,配置多个redis实例      3,安装 ruby和rubygems      4,启动red ...

  3. Redis学习笔记--Redis配置文件redis.conf参数配置详解

    ########################################## 常规 ########################################## daemonize n ...

  4. Redis学习笔记~Redis主从服务器,读写分离

    回到目录 Redis这个Nosql的存储系统一般会被部署到linux系统中,我们可以把它当成是一个数据服务器,对于并发理大时,我们会使用多台服务器充当Redis服务器,这时,各个Redis之间也是分布 ...

  5. redis学习笔记-redis的安装

    Window 下安装 下载地址:https://github.com/MSOpenTech/redis/releases Redis 支持 32 位和 64 位.这个需要根据你系统平台的实际情况选择, ...

  6. Redis学习笔记-Redis内部数据结构

    Redis内部数据结构 Redis和其他key-value数据库的很大区别是它支持非字符串类型的value值.它支持的value值的类型如下: sds (simple dynamic string) ...

  7. redis学习之——redis.conf配置(基本)文件学习

    # Redis configuration file example # Note on units: when memory size is needed, it is possible to sp ...

  8. Redis基础学习(五)—Redis的主从复制

    一.概述     Redis的主从复制策略是通过其持久化的rdb文件来实现的,其过程是先dump出rdb文件,将rdb文件全量传输给slave,然后再将dump后的操作实时同步到slave中.让从服务 ...

  9. Redis学习五:Redis的持久化-RDB

    RDB(Redis DataBase) 一.是什么 1.概念:在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里 2.执行方式: R ...

随机推荐

  1. (转载)Tomcat 7集群浅析

    本文转载自:http://blog.csdn.net/wangyangzhizhou. 如有侵权,请联系处理!   简介 每个节点都要维护一份集群节点信息列表,集群组通知的默认实现是在使用 UDP 数 ...

  2. Leetcode-数组&链表

    常见双指针技巧用法,只总结思路,具体边界判定想不清楚的时候稍微画个图就行了 1. 快慢指针判断链表是否含有环.环入口(快慢指针再次相遇即有环:再从头节点和快慢指针的相遇位置同速度向后,相遇点即为环入口 ...

  3. Python练习题 014:完数

    [Python练习题 014] 一个数如果恰好等于它的因子之和,这个数就称为"完数".例如6=1+2+3.编程找出1000以内的所有完数. -------------------- ...

  4. javascript内置对象的innerText、innerHTML、join方法的认识

    innerText语法规范:HTMLElement.innerText = string ;//后面的赋值是一个字符串形式 innerText是一个非标准形式,不识别HTML标签 返回值会去除空格和换 ...

  5. 01 AS 首次编译执行项目过程中遇到的几个常见问题

    问题01 as打开时出现The environment variable JAVA_HOME (with The value of C:\Java\jdk1.8.0_101\bin) does not ...

  6. ASP。NET Web表单模型,部分呈现和事件

    下载EventExample.zip - 41.33 KB 下载EventandAjaxExample.zip - 41.94 KB 介绍 通过参考ASP获得Web应用程序环境及其约束的概述.NET ...

  7. 部署Prometheus+Grafana监控

    Prometheus 1.不是很友好,各种配置都手写 2.对docker和k8s监控有成熟解决方案 Prometheus(普罗米修斯) 是一个最初在SoudCloud上构建的监控系统,开源项目,拥有非 ...

  8. RHSA-2018:0151-重要: 内核 安全和BUG修复更新(需要重启、存在EXP、本地提权)

    [root@localhost ~]# cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core) 修复命令: 使用root账号登陆She ...

  9. Python+Appium自动化测试(11)-location与size获取元素坐标

    appium做app自动化测试过程中,有时需要获取控件元素的坐标进行滑动操作.appium中提供了location方法获取控件元素左上角的坐标,再通过size方法获取控件元素的宽高,就可以得到控件元素 ...

  10. LVM创建及管理

    安装lvm yum install -y lvm yum install -y lvm