[转帖]浅谈Redis大Key与热Key

https://www.cnblogs.com/jelly12345/p/16424080.html

如何定义大 Key 和热 Key

下述例子中的具体数值仅供参考，在实际的业务中，需要根据 Redis 的实际业务场景进行综合判定。

如何定义大 Key

通常以 Key 的大小和Key中成员的数量来综合判定，例如：

Key 本身的数据量过大：一个 String 类型的 Key，它的值为 5MB。
Key 中的成员过多：一个 ZSET 类型的 Key，它的成员数量为 10,000个。
Key 中成员的数据量过大：一个 Hash 类型的 Key，它的成员数量虽然只有 1,000个，但这些成员的 Value(值)总大小为 100MB。

如何定义热 Key

通常以其接收到的 Key 被请求频率来判定，例如：

QPS 集中在特定的 Key：Redis 实例的总QPS为 10,000, 而其中一个 Key 的每秒访问量达到了 7000。
带宽利用率集中在特定的 Key：对于一个拥有上千个成员且总大小为 1MB 的 HASH Key，每秒发送大量的 HGETALL 请求。
CPU使用时间占比集中在特定的 Key：对于一个拥有数万个成员的 Key(ZSET类型)，每秒发送大量的 ZRANGE 请求。

大 Key 和热 Key 产生的原因

未正确使用 Redis、业务规划不足、无效数据的堆积、访问量突增等都会产生大 Key 与热 Key。

大 Key
- 在不适用的场景下使用 Redis，易造成 Key 的 Value 过大，如使用 String 类型的 Key 存放大体积的二进制文件型数据。
- 业务上线前规划设计不足，没有对 Key 中成员进行合理的拆分，造成个别 Key中的成员数过多。
- 未定期清理无效数据，造成如 HASH 类型 Key 中的成员持续地增加。
- 使用 LIST 类型 Key 的业务消费側发生代码故障，造成对应 Key 的成员只增不减。
热 Key
- 预期外的访问量陡增，如突然出现的爆款商品、访问量暴涨的新闻热点、直播间某主播搞活动带来的大量刷屏点赞等。

大 Key 和热 Key 有哪些危害

大 Key 的危害

内存不均：单 Value 较大时候，可能会导致节点之间内存使用不均匀，导致负载不均衡。
阻塞请求：redis 为单线程，单 Value 较大读写需要较长的处理时间，会阻塞后续的请求处理。
阻塞网络：单 Value 较大时会占用服务器网卡较多带宽，可能导致出口带宽打满，影响该服务器傻姑娘单其它 Redis 实例或应用。

热 Key 的危害

CPU飙升：可能会导致 CPU 使用率飙升到 100%，影响服务器的稳定性和可用性。
阻塞网络：流量集中，达到物理网卡上限，影响其它 Key 的访问(大 Key 也可能导致该问题)
缓存击穿：请求过多，缓存分片被打垮，不能通过扩容解决，且不能发挥集群多分片的优势。

如何发现大 Key 和热 Key

发现大 key 和热 key 的手段主要有一下几种，1.使用 redis 原生自带的方式；2. 使用开源工具；3. 业务层进行统计分析；4. 代理层进行统计分析。下面我们来逐个进行分析。

通过原生自带的方式

通过 redis-cli 的 bigkeys 和 hotkeys 参数查找大 Key 和热 Key

redis 原生提供了一些参数来统计 big key 和 hot key，比如: redis-cli -- bigkeys 命令来统计大 key。

优点
- 方便、快速、安全
缺点
- 分析结果不可定制化，准确性和时效性差。比如 bigkeys 只能返回 Key 的整体统计信息与每个数据类型中 Top1 的大 Key，big Key 仅能分析六种数据类型(STRING、LIST、HASH、ZSET、STREALM)。如果我们只想分析 STRING 类型的大 Key 或者找出成员数量超过 10 个的 HASH Key，则 bigkeys 命令无法直接实现该类需求。

通过 redis-cli 的内置命令查找大 Key 和热 Key

根据大 key 和热 key 的定义，我们也可以直接使用 redis 提供的一些命令进行分析，比如对于 STRING 类型：执行 STRLEN 命令，返回对应 Key 的 Value 的字节数；对于 LIST 类型：执行 LLEN 命令，返回对应 Key 的列表长度等。

优点
- 方便、对线上服务影响小。
缺点
- 返回的 Key 序列化长度并不等同于它在内存空间中的真实长度(因为redis存储的是一个个对象，而不仅仅是value)，因此不够准确，仅可作为参考。

通过 redis-cli 的 MONITOR 查找热 Key

Redis 的 MONITOR 命令能够忠实打印出 Redis 中的所有请求(类似 MySQL 的 general log)，包括时间信息、Client 信息、命令以及 Key 信息。在发生紧急情况时，可以通过短暂执行 MONITOR 命令并将返回信息输入至文件，在关闭 MONITOR 命令后，对文件中请求进行归类分析，找出这段时间中的热 Key。由于 MONITOR 命令对 Redis 的性能消耗较大，非特殊情况不推荐使用 MONITOR 命令。

优点
- 方便、安全
缺点
- 会占用 CPU、内存、网络资源、实效性和准确性较差。

通过开源工具

除了使用 redis 原生自带的参数或命令外，我们还可以使用一些开源工具对 rdb 文件进行解析统计。比如可以使用Redis-rdb-tools，它是通过 Python 进行编写，支持定制化分析 Redis RDB 快照的开源工具。可以根据自己的精细化需求，全面地分析 Redis 实例中所有 Key 的内存占用情况，同时也支持灵活地分析查询。

优点
- 支持定制化分析，对线上服务无影响。
缺点
- 实效性差，RDB 文件较大时耗时较长。

客户端统计分析

除了在 redis 側进行分析统计，也可以在业务側对热 Key 进行统计，比如在 Redis 的 SDK 中封装相应的逻辑，在业务层增加对 Redis 的访问进行记录并异步汇总分析。

优点
- 可准切并及时地定位热 Key
缺点
- 业务代码复杂度的增加，同时可能会降低一些客户端性能。

代理层统计分析

除了在 Redis 服务侧，业务側进行统计分析，部分云厂商在售卖它们的 Redis 产品时，一般都会提供代理(Proxy), 用于集群模式下的读写分离等功能，当然不止这一个功能，比如Ali 的云数据库 Redis 产品，它的 Proxy 还能对热 Key 进行分析统计，并且进行缓存，这样可以降低 Redis 服务端的访问压力。其它云厂商也纷纷都有自己的代理。

优点
- 对业务代码无侵入
- 对线上服务无影响，甚至可以降低服务端的压力
缺点
- 一般只有云厂商才提供，不具有普遍性。
- 代理层缓存的 Key 的查询结果在有效时间内不会更新，需要业务侧允许一段时间的缓存不一致。
- 统计不是十分准确，每一个 Proxy 只能统计自己的热 Key。

如何解决大 Key 热 Key

处理大 Key

对大 Key 进行拆分
对大 Key 进行清理
监控 Redis 的内存水位
对过期数据进行定期清理

处理热 Key

在集群模式中对热 Key 进行复制
使用读写分离架构
代理层的查询缓存(比如Ali的 QueryCache)

业界采用的一些定制化解决方案

有赞采用的方案

有赞有自己的TMC, 它是一个缓存解决方案，用于帮助应用层解决缓存使用过程中出现的热点访问问题。主要是通过增加本地缓存来降低对下游缓存服务的冲击。

美团采用的方案

美团有自己的 KV 存储服务Squirrel。它在节点内会对每个请求 Key 进行统计，当满足热点 Key 时，对该热点 Key 进行流控，同时检控服务会周期性的去所有 Redis 上查询统计到的热点 Key，如果有热点 Key，监控服务就会把热点 Key 所在 Slot 上报到迁移服务。迁移服务这时会把热点主从节点加到这个集群中，然后把热 Slot 迁移到这个热点主从上，因为热点主从上只有热点 Slot 的请求，所以热点 Key 的处理能力得到了大幅提升。通过这样的设计，我们可以做到实时的热点监控，并及时通过流控去止损；通过热点迁移，我们能做到自动的热点隔离和快速的容量扩充。

参考资料

所有博文均为原著，如若转载，请注明出处！

[转帖]浅谈Redis大Key与热Key的更多相关文章

浅谈Redis大Key与热Key
如何定义大 Key 和热 Key 如何定义大 Key 如何定义热 Key 大 Key 和热 Key 产生的原因大 Key 和热 Key 有哪些危害大 Key 的危害热 Key 的危害如何 ...
Python 基于python+mysql浅谈redis缓存设计与数据库关联数据处理
基于python+mysql浅谈redis缓存设计与数据库关联数据处理 by:授客 QQ:1033553122 测试环境 redis-3.0.7 CentOS 6.5-x86_64 python 3 ...
$.ajax()方法详解 ajax之async属性【原创】详细案例解剖——浅谈Redis缓存的常用5种方式（String，Hash，List，set，SetSorted ）
$.ajax()方法详解 jquery中的ajax方法参数总是记不住,这里记录一下. 1.url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2.type: 要求为Str ...
谁还没遇上过NoClassDefFoundError咋地——浅谈字节码生成与热部署
谁还没遇上过NoClassDefFoundError咋地--浅谈字节码生成与热部署前言在Java程序员的世界里,NoClassDefFoundError是一类相当令人厌恶的错误,因为这类错误通常非 ...
浅谈redis和memcached的区别
缓存技术方面说到redis大家必然会联想到memcached,了解它们的人应该都知道以下几点吧 redis与 memcached相比,redis支持key-value数据类型,同事支持list.set ...
浅谈Redis面试热点之工程架构篇[1]
前言前面用两篇文章大致介绍了Redis热点面试中的底层实现相关的问题,感兴趣的可以回顾一下:[决战西二旗]|Redis面试热点之底层实现篇[决战西二旗]|Redis面试热点之底层实现篇(续) 接下来 ...
[转帖]浅谈分布式一致性与CAP/BASE/ACID理论
浅谈分布式一致性与CAP/BASE/ACID理论 https://www.cnblogs.com/zhang-qc/p/6783657.html ##转载请注明 CAP理论(98年秋提出,99年正式发 ...
[转帖]浅谈响应式编程（Reactive Programming）
浅谈响应式编程(Reactive Programming) https://www.jianshu.com/p/1765f658200a 例子写的非常好呢. 0.9312018.02.14 21:22 ...
[转帖]浅谈IOC--说清楚IOC是什么
浅谈IOC--说清楚IOC是什么 Need Study https://www.cnblogs.com/DebugLZQ/archive/2013/06/05/3107957.html 博文目录 1. ...
[]转帖] 浅谈Linux下的五种I/O模型
浅谈Linux下的五种I/O模型 https://www.cnblogs.com/chy2055/p/5220793.html 一.关于I/O模型的引出我们都知道,为了OS的安全性等的考虑,进程是 ...

随机推荐

借问变量何处存,牧童笑称用指针,Go lang1.18入门精炼教程，由白丁入鸿儒，go lang类型指针(Pointer)的使用EP05
指针是指什么?指针是存储另一个变量的内存地址的变量.变量是一种使用方便的占位符,用于引用计算机内存地址,一个指针变量可以指向任何一个值的内存地址它指向那个值的内存地址.类比的话,指针就是书籍中的目录, ...
鸿蒙轻内核M核源码分析：数据结构之任务就绪队列
摘要:本文会给读者介绍鸿蒙轻内核M核源码中重要的数据结构,任务基于优先级的就绪队列Priority Queue. 本文分享自华为云社区<鸿蒙轻内核M核源码分析系列三数据结构-任务就绪队列> ...
万字保姆级长文——Linkedin元数据管理平台Datahub离线安装指南
元数据管理平台Datahub最近的热度越来越高.已经更新到了0.8.40的版本,来咨询我的小伙伴也越来越多,特别是安装过程有很多问题. 考虑到有些企业部分数据服务是部署在内网的,那么离线安装D ...
使用appuploader工具发布证书和描述性文件教程
使用APPuploader工具发布证书和描述性文件教程之前用AppCan平台开发了一个应用,平台可以同时生成安卓版和苹果版,想着也把这应用上架到App Store试试,于是找同学借了个苹果开发者账号 ...
揭露ROI提升5倍的秘密！火山引擎A/B测试白皮书重磅发布（内附下载链接）
- 文末立即下载白皮书原文 - 近期,<火山引擎A/B测试总体经济影响白皮书>正式发布.这份白皮书由市场研究公司Forrester调研撰写,揭示了A/B测试对于企业营收增长.运营成本.生 ...
打通数据治理全链路，火山引擎DataLeap数据治理平台公有云版本正式发布
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群近日,火山引擎DataLeap正式对外发布数据治理平台公有云版.DataLeap是火山引擎大数据研发治理套件, ...
大数据 - DWD&DIM 行为数据
我们前面采集的日志数据已经保存到 Kafka 中,作为日志数据的 ODS 层,从 Kafka 的ODS 层读取的日志数据分为 3 类, 页面日志.启动日志和曝光日志.这三类数据虽然都是用户行为数据,但 ...
sqlalchemy 查询已存在表(无model定义)
已存在的表信息如下,该表不是由sqlalchemy创建.想要对该表做CRUD,可以通过sqlalchemy提供的一个解析方法完成. 示例代码: from sqlalchemy import creat ...
LeetCode 第 193 场周赛解题报告
5436. 一维数组的动态和时间复杂度:O(n) 知识点:前缀和根据题目给出的公式 runningSum[i] = sum(nums[0]-nums[i]),可得: 当 i > 0 时,ru ...
ZOJ - 1610 区间修改+暴力单点查询
一.内容题意:给定[1,8000]区间,给定n组操作,每次将一段区间修改成某种颜色(对上一次颜色进行覆盖),最后问你能看到多少种颜色,且每种颜色有多少段. 二.思路题目给定的区间是(x, y]左开 ...

[转帖]浅谈Redis大Key与热Key

如何定义大 Key 和 热 Key

如何定义大 Key

如何定义热 Key

大 Key 和 热 Key 产生的原因

大 Key 和 热 Key 有哪些危害

大 Key 的危害

热 Key 的危害

如何发现大 Key 和 热 Key

通过原生自带的方式

通过 redis-cli 的 bigkeys 和 hotkeys 参数查找大 Key 和热 Key

通过 redis-cli 的内置命令查找大 Key 和热 Key

通过 redis-cli 的 MONITOR 查找热 Key

通过开源工具

客户端统计分析

代理层统计分析

如何解决大 Key 热 Key

处理大 Key

处理热 Key

业界采用的一些定制化解决方案

有赞采用的方案

美团采用的方案

参考资料

[转帖]浅谈Redis大Key与热Key的更多相关文章

随机推荐

热门专题

如何定义大 Key 和热 Key

大 Key 和热 Key 产生的原因

大 Key 和热 Key 有哪些危害

如何发现大 Key 和热 Key