redis入门到精通系列(七):redis高级数据类型详解(BitMaps,HyperLogLog,GEO)
高级数据类型和五种基本数据类型不同,并非新的数据结构。高级数据类型往往是用来解决一些业务场景。
(一)BitMaps
(1.1) BitMaps概述
在应用场景中,有一些数据只有两个属性,比如是否是学生,是否是党员等等,对于这些数据,最节约内存的方式就是用bit去记录,以是否是学生为例,1代表是学生,0代表不是学生。那么1000110就代表7个人中3个是学生,这就是BitMaps的存储需求。
Bitmaps是一个可以对位进行操作的字符串,我们可以把Bitmaps想象成是一串二进制数字,每个位置只存储0和1。下标是Bitmaps的偏移量(offset)
(1.2) BitMaps操作
获取指定key对应的偏移量上的bit值
getbit key offset
设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
对指定key按位进行交、并、非、异或操作,并把结果保存到destKey中
-
bitop and destKey key1 key2.... //交
-
bitop or destKey key1 key2.... //并
-
bitop not destKey key1 key2.... //非
-
bitop xor destKey key1 key2.... //异或
统计指定key中1的数量
bitcount key start end
(1.3) BitMaps应用场景
我们假设一家公司要统计他们所有注册会员的每日/每周/每年登陆网站的情况,就可以使用BitMaps。其中每日登陆会员数量的统计方法如下:建立一个key值为当前日期的BitMaps,当id为5的会员登陆时,设置偏移量为4(下标从0开始),将BitMaps偏移量为4的数设置为1,以此类推。统计每日登陆的会员数就用bitcount命令统计即可。
统计每周登陆会员数量的方法如下:对于统计每周登陆会员数,只需要将一周7天的数据使用并(or)操作计算即可。一个会员只要有一天的值等于1,那么并操作之后他的值就等于1,说明这一周他登陆了。再用bitcount统计即可。
(二)HyperLogLog
HyperLogLog是用来做基数统计的,所谓基数统计,就是指一串数字中不重复的数字个数,如{1,2,1,2,3}的基数就是3。
添加数据:
pfadd key element1 element2...
统计数据
pfcount key1 key2...
合并数据
pfmerge destkey sourcekey1 sourcekey2...
HyperLogLog使用问题:
首先HyperLogLog只能记录数据。
由于核心的基数估计算法,在数量很大时有0.81%的误差。
占用空间很小,每个hyperLogLog只占用12k的内存。
pfadd命令不是一次性分配12k的数据,会随着基数的增加内存逐渐增大。
pfmerge命令合并后占用的存储空间为12k,无论之前的数据量为多少。
(三)GEO
GEO是redis中关于地理位置计算的高级数据类型,比如微信中的附近好友会展示好友离你的距离,这就是GEO的一个应用。
添加坐标点:
geoadd key longitude latitude member [longitude latitude member...]
获取坐标点
geopos key member
计算坐标距离
geodist key member1 member2 [unit] unit表示单位,默认m,可以设置 km, ft, mi
为了简单起见我把横纵坐标用简单的数字表示
根据坐标求范围内的数据(withcoord显示坐标,withdist显示距离,withhash显示hash值,count count用来取范围)
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
根据点求范围内数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
获取指定点对应的坐标hash值
geohash key member1 member2...
redis入门到精通系列(七):redis高级数据类型详解(BitMaps,HyperLogLog,GEO)的更多相关文章
- redis入门到精通系列(四):Jedis--使用java操作redis详解
(一)前言 如果不把数据库和后端语言联系起来,就起不到数据库应该要起到的作用.Java语言通过JDBC操作mysql,用Jedis操作redis.当然了,java操作redis的方式不止jedis一种 ...
- redis入门到精通系列(二):redis操作的两个实践案例
在前面一篇博客中我们已经学完了redis的五种数据类型操作,回顾一下,五种操作类型分别为:字符串类型(string).列表类型(list).散列类型(hash).集合类型(set).有序集合类型(so ...
- SaltStack 入门到精通第二篇:Salt-master配置文件详解
SaltStack 入门到精通第二篇:Salt-master配置文件详解 转自(coocla):http://blog.coocla.org/301.html 原本想要重新翻译salt-mas ...
- redis入门到精通系列(一)
(一)为什么要用Nosql 如果你是计算机本科学生 ,那么一定使用过关系型数据库mysql.在请求量小的情况下,使用mysql不会有任何问题,但是一旦同时有成千上万个请求同时来访问系统时,就会出现卡顿 ...
- redis入门到精通系列(六):redis的事务详解
(一)事务的概念 谈到数据库的高级应用,不可避免会谈到事务.熟悉mysql的朋友们对事务肯定不陌生,简单来讲事务就是控制一个数据库操作序列要么全部执行要么全部不执行.今天我们就来了解redis中的事务 ...
- redis入门到精通系列(三):key的通用操作和redis内部db的通用操作
五种数据类型都用到了key,key本身是一种字符串,通过key可以获取redis中保存的对象.这一篇博客就将介绍key的通用操作. (一)key基本操作 删除key del key key是否存在 e ...
- redis入门到精通系列(九):redis哨兵模式详解
(一)哨兵概述 前面我们讲了redis的主从复制,为了实现高可用,会选择一台服务器作为master,多台服务器作为slave.现在有这样一种情况,master宕机了,这时系统会选择一台slave作为m ...
- redis入门到精通系列(八):redis的高可用--主从复制详解
(一)主从复制介绍 前面所讲的关于redis的操作都属于单机操作,单机操作虽然操作简单,但是处理能力有限,无法高可用.所谓高可用性,就是指当一台服务器宕机的时候,有备用的服务器能顶替上,在单机操作上这 ...
- redis入门到精通系列(五):redis的持久化操作(RDB、AOF)
(一)持久化的概述 持久化顾名思义就是将存储在内存的数据转存到硬盘中.在生活中使用word等应用的时候,如果突然遇到断电的情况,理论上数据应该是都不见的,因为没有保存的word内容都存放在内存里,断电 ...
随机推荐
- SpringCloud升级之路2020.0.x版-33. 实现重试、断路器以及线程隔离源码
本系列代码地址:https://github.com/JoJoTec/spring-cloud-parent 在前面两节,我们梳理了实现 Feign 断路器以及线程隔离的思路,并说明了如何优化目前的负 ...
- PAT A1039、A1047——vector常见用法
vector 常用函数实例 (1)push_back() (2)pop_back() (3)size() (4)clear():清空vector中所有元素 (5)insert():insert(it, ...
- springboot启动流程1
public SpringApplication(ResourceLoader resourceLoader, Class<?>... primarySources) { this.res ...
- 分布式多任务学习论文阅读(四):去偏lasso实现高效通信
1.难点-如何实现高效的通信 我们考虑下列的多任务优化问题: \[ \underset{\textbf{W}}{\min} \sum_{t=1}^{T} [\frac{1}{m_t}\sum_{i=1 ...
- Codeforces 566E - Restoring Map(bitset 优化构造)
Codeforces 题目传送门 & 洛谷题目传送门 本来说好的不做,结果今早又忍不住开了道题/qiao 我们称度为 \(1\) 的点为叶节点,度大于 \(1\) 的点为非叶节点. 首先考虑如 ...
- AT695 マス目
AT695 マス目 本题选自 DP 优化方法大杂烩 状压部分. 这个题很 nb.下文记 \(n=H\),\(m=W\). 对于每一列,如果只记录一个格子是否为黑色,那么发现它无法处理从右边绕到左边再绕 ...
- 比对软件Blast,Blast+,Diamond比较
1. Blast (1)格式化数据库 formatdb -i db.seq -p T -o T -l logfile 主要参数: -i 输入需要格式化的源数据库名称 -p 文件类型,是核苷酸序列数据库 ...
- 变量、内存区域、MDK文件(map、htm)
变量分为:局部变量和全局变量 局部变量:函数体内部定义的变量,作用域为函数内部,static声明(静态局部变量)该变量则函数调用结束后不消失而保留值,分配的存储空间不释放. 全局变量:函数体外部定义的 ...
- 28-Merge Two Sorted Lists
easy 21. Merge Two Sorted Lists Merge two sorted linked lists and return it as a new list. The new l ...
- Windows端口被占用解决方法
Error 场景 启动 Java 项目失败,控制台显示 Error starting ApplicationContext. To display the conditions report`re-r ...