假如给你1亿的Redis key,如何高效统计?
前言
有些小伙伴在工作中,可能遇到过这样的场景:老板突然要求统计Redis中所有key的数量,你随手执行了KEYS *命令,下一秒监控告警疯狂闪烁——整个Redis集群彻底卡死,线上服务大面积瘫痪。
今天这篇文章就跟大家一起聊聊如果给你1亿个Redis key,如何高效统计这个话题,希望对你会有所帮助。
1 为什么不建议使用KEYS命令?
Redis的单线程模型是其高性能的核心,但也是最大的软肋。
当Redis执行 KEYS * 命令时,内部的流程如下:

Redis的单线程模型是其高性能的核心,但同时也带来一个关键限制:所有命令都是串行执行的。
当我们执行 KEYS * 命令时:
Redis必须遍历整个key空间(时间复杂度O(N))
在遍历完成前,无法处理其他任何命令
对于1亿个key,即使每个key查找只需0.1微秒,总耗时也高达10秒!
致命三连击:
- 时间复杂度:1亿key需要10秒+(实测单核CPU 0.1μs/key)
- 内存风暴:返回结果太多可能撑爆客户端内存
- 集群失效:在Cluster模式中只能查当前节点的数据。
如果Redis一次性返回的数据太多,可能会有OOM问题:
127.0.0.1:6379> KEYS *
(卡死10秒...)
(error) OOM command not allowed when used memory > 'maxmemory'
超过了最大内存。
那么,Redis中有1亿key,我们要如何统计数据呢?
2 SCAN命令
SCAN命令通过游标分批遍历,每次只返回少量key,避免阻塞。
Java版基础SCAN的代码如下:
public long safeCount(Jedis jedis) {
long total = 0;
String cursor = "0";
ScanParams params = new ScanParams().count(500); // 每批500个
do {
ScanResult<String> rs = jedis.scan(cursor, params);
cursor = rs.getCursor();
total += rs.getResult().size();
} while (!"0".equals(cursor)); // 游标0表示结束
return total;
}
使用游标查询Redis中的数据,一次扫描500条数据。
但问题来了:1亿key需要多久?
- 每次SCAN耗时≈3ms
- 每次返回500key
- 总次数=1亿/500=20万次
- 总耗时≈20万×3ms=600秒=10分钟!
3 多线程并发SCAN方案
现代服务器都是多核CPU,单线程扫描是资源浪费。
看多线程优化方案如下:

多线程并发SCAN代码如下:
public long parallelCount(JedisPool pool, int threads) throws Exception {
ExecutorService executor = Executors.newFixedThreadPool(threads);
AtomicLong total = new AtomicLong(0);
// 生成初始游标(实际需要更智能的分段)
List<String> cursors = new ArrayList<>();
for (int i = 0; i < threads; i++) {
cursors.add(String.valueOf(i));
}
CountDownLatch latch = new CountDownLatch(threads);
for (String cursor : cursors) {
executor.execute(() -> {
try (Jedis jedis = pool.getResource()) {
String cur = cursor;
do {
ScanResult<String> rs = jedis.scan(cur, new ScanParams().count(500));
cur = rs.getCursor();
total.addAndGet(rs.getResult().size());
} while (!"0".equals(cur));
latch.countDown();
}
});
}
latch.await();
executor.shutdown();
return total.get();
}
使用线程池、AtomicLong和CountDownLatch配合使用,实现了多线程扫描数据,最终将结果合并。
性能对比(32核CPU/1亿key):
| 方案 | 线程数 | 耗时 | 资源占用 |
|---|---|---|---|
| 单线程SCAN | 1 | 580s | CPU 5% |
| 多线程SCAN | 32 | 18s | CPU 800% |
4 分布式环境的分治策略
如果你的系统重使用了Redis Cluster集群模式,该模式会将数据分散在16384个槽(slot)中,统计就需要节点协同。
流程图如下:

每一个Redis Cluster集群中的master服务节点,都负责统计一定范围的槽(slot)中的数据,最后将数据聚合起来返回。
集群版并行统计代码如下:
public long clusterCount(JedisCluster cluster) {
Map<String, JedisPool> nodes = cluster.getClusterNodes();
AtomicLong total = new AtomicLong(0);
nodes.values().parallelStream().forEach(pool -> {
try (Jedis jedis = pool.getResource()) {
// 跳过从节点
if (jedis.info("replication").contains("role:slave")) return;
String cursor = "0";
do {
ScanResult<String> rs = jedis.scan(cursor, new ScanParams().count(500));
total.addAndGet(rs.getResult().size());
cursor = rs.getCursor();
} while (!"0".equals(cursor));
}
});
return total.get();
}
这里使用了parallelStream,会并发统计Redis不同的master节点中的数据。
5 毫秒统计方案
方案1:使用内置计数器
如果只想统计一个数量,可以使用Redis内置计数器,瞬时但非精确。
127.0.0.1:6379> info keyspace
# Keyspace
db0:keys=100000000,expires=20000,avg_ttl=3600
优点:毫秒级返回。
缺点:包含已过期未删除的key,法按模式过滤数据。
方案2:实时增量统计
实时增量统计方案精准但复杂。
基于键空间通知的实时计数器,具体代码如下:
@Configuration
public class KeyCounterConfig {
@Bean
public RedisMessageListenerContainer container(RedisConnectionFactory factory) {
RedisMessageListenerContainer container = new RedisMessageListenerContainer();
container.setConnectionFactory(factory);
container.addMessageListener((message, pattern) -> {
String event = new String(message.getBody());
if(event.startsWith("__keyevent@0__:set")) {
redisTemplate.opsForValue().increment("total_keys", 1);
} else if(event.startsWith("__keyevent@0__:del")) {
redisTemplate.opsForValue().decrement("total_keys", 1);
}
}, new PatternTopic("__keyevent@*"));
return container;
}
}
使用监听器统计数量。
成本分析:
- 内存开销:额外存储计数器
- CPU开销:增加5%-10%处理通知
- 网络开销:集群模式下需跨节点同步
6 如何选择方案?
本文中列举出了多个统计Redis中key的方案,那么我们在实际工作中如何选择呢?
下面用一张图给大家列举了选择路线:

各方案的时间和空间复杂度如下:
| 方案 | 时间复杂度 | 空间复杂度 | 精度 |
|---|---|---|---|
| KEYS命令 | O(n) | O(n) | 精确 |
| SCAN遍历 | O(n) | O(1) | 精确 |
| 内置计数器 | O(1) | O(1) | 不精确 |
| 增量统计 | O(1) | O(1) | 精确 |
硬件法则:
- CPU密集型:多线程数=CPU核心数×1.5
- IO密集型:线程数=CPU核心数×3
- 内存限制:控制批次大小(count参数)
常见的业务场景:
- 电商实时大屏:增量计数器+RedisTimeSeries
- 离线数据分析:SCAN导出到Spark
- 安全审计:多节点并行SCAN
终极箴言:
精确统计用分治
实时查询用增量
趋势分析用采样
暴力遍历是自杀
真正的高手不是能解决难题的人,而是能预见并规避难题的人。
在海量数据时代,选择比努力更重要——理解数据本质,才能驾驭数据洪流。
如果这篇文章对您有所帮助,或者有所启发的话,帮忙关注一下我的同名公众号:苏三说技术,我的所有文章都会在公众号上首发,您的支持是我坚持写作最大的动力。
求一键三连:点赞、转发、在看。
关注公众号:【苏三说技术】,在公众号中回复:进大厂,可以免费获取我最近整理的10万字的面试宝典,好多小伙伴靠这个宝典拿到了多家大厂的offer。
本文收录于我的技术网站:http://www.susan.net.cn
假如给你1亿的Redis key,如何高效统计?的更多相关文章
- Redis Key 命令
Redis Key 命令 del key1 key2 - keyn 删除键为key1,key2-keyn,空格分隔. persist key 移除给定 key 的生存时间,将这个 key ...
- springboot redis key乱码
原写法: @Autowired private RedisTemplate redisTemplate; 写入redis后,查看key值 127.0.0.1:6379> keys * 1) &q ...
- redis key的过期时间
设置redis key的生存过期时间 Redis 有四个不同的命令可以用于设置键的生存时间(键可以存在多久)或过期时间(键什么时候会被删除) : EXPlRE 命令用于将键key 的生存时间设置为tt ...
- 如何利用redis key过期事件实现过期提醒
https://blog.csdn.net/zhu_tianwei/article/details/80169900 redis自2.8.0之后版本提供Keyspace Notifications功能 ...
- Spring boot实现监听Redis key失效事件实现和其它方式
需求: 处理订单过期自动取消,比如下单30分钟未支付自动更改订单状态 用户绑定隐私号码当订单结束取消绑定等 解决方案1: 可以利用redis自带的key自动过期机制,下单时将订单id写入redis,过 ...
- SpringBoot实现监听redis key失效事件
需求: 处理订单过期自动取消,比如下单30分钟未支付自动更改订单状态 解决方案1: 可以利用redis天然的key自动过期机制,下单时将订单id写入redis,过期时间30分钟,30分钟后检查订单状态 ...
- Redis Key操作
[Redis Key操作] 1.GETSET key value 将给定 key 的值设为 value ,并返回 key 的旧值(old value). 当 key 存在但不是字符串类型时,返回一个错 ...
- 17 redis -key设计原则
书签系统 create table book ( bookid int, title char(20) )engine myisam charset utf8; insert into book va ...
- 关于redis key命名规范的设计
一.实现目标 简洁,高效,可维护 二.键值设计规约 1 . Redis key命名风格 [推荐]Redis key命名需具有可读性以及可管理性,不该使用含义不清的key以及特别长的key名: [强制] ...
- 分享一个Python脚本--统计redis key类型数据大小分布
概述 今天主要介绍怎么统计redis key类型数据大小分布. 原理:使用redis命令: scan.pipline.type 和 debug object 来得到 redis key 信息. 脚本 ...
随机推荐
- 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
效果 来具体介绍之前先来看看效果. 使用C#构建了一个简单的MCP客户端,以下为运行这个简单客户端的截图,同样可以在Cline等其它的一些MCP客户端中玩耍. 创建一个数据库表: 获取数据库中的所有表 ...
- RabbitMQ持久化+消息执行优先级
持久化 channel.QueueDeclare(queue:"hello",//队列名 durable:true,//持久化 exclusive:false,//排他性,该 ...
- 【JDBC第4章】操作BLOB类型字段
第4章:操作BLOB类型字段 4.1 MySQL BLOB类型 MySQL中,BLOB是一个二进制大型对象,是一个可以存储大量数据的容器,它能容纳不同大小的数据. 插入BLOB类型的数据必须使用Pre ...
- leetcode每日一题:判断一个括号字符串是否有效
题目 一个括号字符串是只由 '(' 和 ')' 组成的 非空 字符串.如果一个字符串满足下面 任意 一个条件,那么它就是有效的: 字符串为 (). 它可以表示为 AB(A 与 B 连接),其中A 和 ...
- java一个校验对象是否为null的豪华大礼包
自写的校验所有类型是否为null的工具类, 懒人福音,嘎嘎好用. 1 /** 2 * 一个校验对象是否为null的豪华大礼包 3 * 可以校验:Collection,Map,String,Enumer ...
- CentOS linux安装nginx
1.下载nginx-1.21.3.tar.gz 及 nginx-upstream-fair-master.zip 2.上传nginx-upstream-fair-master至/app/server/ ...
- Hystrix两种隔离方式对比
在微服务架构中,我们不可避免的与Hystrix打交道,最近在面试过程中,也总是被问到Hystrix两种熔断方式的区别,今天,就给大家做个小结. 首先,Hystrix熔断方式主要有两种: 线程池隔离 ...
- SearXNG+MCP实现搜索引擎,想怎么搜就怎么搜
一.概述 MCP应用市场,有很多搜索引擎的应用.但是你们会发现,普遍都需要api-key.你必须花钱购买api-key才能实现搜索功能. 问题来了,我就想用免费搜索的,就向百度一样,可不可以? 答案是 ...
- DPDI(Dispatch PDI)kettle调度管理平台之实操演练第003讲-数据通途:客户端连接SQL Server的完美攻略
SQL Server简介 基本概念 SQL Server是由微软公司开发的关系型数据库管理系统.它基于SQL(Structured Query Language,结构化查询语言)来管理和操作数据.SQ ...
- C# Delegate 委托及事件
1.委托Delegate实质 由一个修饰符+ delegate,跟方法的定义比较类似,也需要声明参数和返回值.声明一个委托,就是声明一种方法签名(参数+返回值),只要是和声明委托方法签名相同的方法, ...