上一章我们讲了Redis的底层数据结构,不了解的人可能会有疑问:这个和平时用的五大对象有啥关系呢?这一章我们就主要解释他们所建立的联系。

看这个文章之前,如果对ziplist、skiplist、intset等数据结构不熟悉的话,建议先回顾一下上一章节:面试官:你看过Redis数据结构底层实现吗?

0. 五类对象分别是什么

五类对象就是我们常用的string、list、set、zset、hash

1. 为什么要有对象

我们平时主要是通过操作对象的api来操作redis,而不是通过它的调用它底层数据结构来完成(外观模式)。但我们还需要了解其底层,只有这样才能写最优化高效的代码。

  1. 跟java一样,对象使开发更方便简洁,降低开发门槛。开发者不需要了解其复杂的底层API,直接调用高层接口即可实现开发。

  2. Redis根据对象类型来判断命令是否违法,如果你set key value1 value2就报错。

  3. 对象下可以包含多种数据结构,使数据存储更加多态化。(下面主讲)

  4. Reids基于对象做了垃圾回收(引用计数法)。

  5. 对象带有更丰富的属性,来帮助redis实现更高级的功能。(比如对象的闲置时间)。

2. Redis对象(RedisObject)源码分析

typedef struct redisObject {

    // 类型
unsigned type:4; // 编码
unsigned encoding:4; // 指向底层实现数据结构的指针
void *ptr; // ... } robj;

type字段

记录对象类型。

我们平时用的命令type <key>,其实就是返回这个字段的属性。

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> type hello
string
127.0.0.1:6379> rpush list 1 2 3
(integer) 3
127.0.0.1:6379> type list
list
...

那type有多少中类型呢?看下面这个表:

encoding字段

记录对象使用的编码(数据结构),Reids中称数据结构为encoding。

我们可以这样查看我们redis对象中的encoding:

127.0.0.1:6379> object encoding hello
"embstr"
127.0.0.1:6379> object encoding list
"quicklist"
...

既然它是标明该redisObject是使用的什么数据结构,那肯定也有个对应的表:

我们可以看到,Redis对对象的底层encoding分的很细,String类型就有三个,其它四个对象都分别有两种不同的底层数据结构的实现。他们有一规律,就是用ziplistintsetembstr来实现少量的数据,数据量一旦庞大,就会升级到skiplistrawlinkedlistht来实现,后面我会仔细讲解。

3. 分别分析各个对象的底层编码实现(数据结构)

3.1 字符串(string)

字符串编码有三个:int、raw、embstr。

3.1.1 int

当string对象的值全部是数字,就会使用int编码。

127.0.0.1:6379> set number 123455
OK
127.0.0.1:6379> object encoding number
"int"
3.1.2 embstr

字符串或浮点数长度小于等于39字节,就会使用embstr编码方式来存储,embstr存储内存一般很小,所以redis一次性分配且内存连续(效率高)。

127.0.0.1:6379> set shortStr "suwe suwe suwe"
OK
127.0.0.1:6379> object encoding shortStr
"embstr"
3.1.2 raw

当一个字符串或浮点数长度大于39字节,就使用SDS来保存,编码为raw,由于不确定值的字节大小,所以键和值各分配各的,所以就分配两次内存(回收也是两次),同理它一定不是内存连续的。

127.0.0.1:6379> set longStr "hello everyone, we dont need to sleep around to go aheard! do you think?"
OK
127.0.0.1:6379> object encoding longStr
"raw"
3.1.3 编码转换

前面说过,Redis会自动对编码进行转换来适应和优化数据的存储。

int->raw

条件:数字对象进行append字母,就会发生转换。

127.0.0.1:6379> object encoding number
"int"
127.0.0.1:6379> append number " is a lucky number"
(integer) 24
127.0.0.1:6379> object encoding number
"raw"

embstr->raw

条件:对embstr进行修改,redis会先将其转换成raw,然后才进行修改。所以embstr实际上是只读性质的。

127.0.0.1:6379> object encoding shortStr
"embstr"
127.0.0.1:6379> append shortStr "(hhh"
(integer) 18
127.0.0.1:6379> object encoding shortStr
"raw"

3.2 列表(list)

列表对象编码可以是:ziplist或linkedlist。

  1. ziplist压缩列表不知道大家还记得不,就是zlbytes zltail zllen entry1 entry2 ..end结构,entry节点里有pre-length、encoding、content属性,忘记的可以返回去看下。

  2. linkedlist,类似双向链表,也是上一章的知识。

3.2.1 编码转换

ziplist->linkedlist

条件:列表对象的所有字符串元素的长度大于等于64字节 & 列表元素数大于等于512. 反之,小于64和小于512会使用ziplist而不是用linkedlist。

这个阈值是可以修改的,修改选项:list-max-ziplist-valuelist-max-ziplist-entriess

3.3 哈希(hash)

哈希对象的编码有:ziplist和hashtable

3.3.1 编码转换

ziplist->hashtable

条件:哈希对象所有键和值字符串长度大于等于64字节 & 键值对数量大于等于512

这个阈值也是可以修改的,修改选项:hash-max-ziplist-valuehash-max-ziplist-entriess

3.4. 集合(set)

集合对象的编码有:intset和hashtable

3.4.1 intset
  1. 集合对象所有元素都是整数

  2. 集合对象元素数不超过512个

3.4.2 编码转换

intset->hashtable

条件:元素不都是整数 & 元素数大于等于512

3.5. 有序集合(zset)

有序集合用到的编码:ziplist和skiplist

大家可能很好奇阿,ziplist的entry中只有属性content可以存放数据,集合也是key-value形式,那怎么存储呢?

第一个节点保存key、第二个节点保存value 以此类推...

3.5.1 为什么要用这两个编码
  1. 如果只用ziplist来实现,无法做到元素的排序,不支持范围查找,能做到元素的快速查找。

  2. 如果只用skiplist来实现,无法做到快速查找,但能做到元素排序、范围操作。

3.5.2 编码转换

ziplist->skiplist

条件:有序集合元素数 >= 128 & 含有元素的长度 >= 64

这个阈值也是可以修改的,修改选项:zset-max-ziplist-valuezset-max-ziplist-entriess

4. 垃圾回收

为什么要说内存回收呢,因为redisObject有一个字段:

typedef struct redisObject {

    // ...

    // 引用计数
int refcount; // ... } robj;

redis的垃圾回收采用引用计数法(和jvm一样),底层采用一个变量对对象的使用行为进行计数。

  • 初始化为1

  • 对象被引用,+1

  • 对象引用消除,-1

  • 计数器==0, 回收对象

5. 对象共享

5.1 对象共享的体现

  1. redis中,值是整数值且相等的两个对象,redis会将该对象进行共享,且引用计数+1

  2. redis启动会自动生成0-9999的整数值放到内存中来共享。

5.2 为什么要对象共享

节约内存

5.3 为什么不对字符串进行共享

成本太高。

验证整数相等只需要O(1)的时间复杂度,而验证字符串要O(n).

6. 对象的空闲时长

最后,redisObject还有一个字段,记录了对象最后一次被访问的时间:

typedef struct redisObject {

    // ...

    unsigned lru:22;

    // ...

} robj;

因为这个字段记录对象最后一次被访问的时间,所以它可以用来查看该对象多久未使用,即:用当前时间-lru

127.0.0.1:6379> object idletime hello
(integer) 5110

它还关系到redis的热点数据实现,如果我们选择lr算法,当内存超出阈值后会对空闲时长较高的对象进行释放,回收内存。

参考文献:

  1. 《Redis设计与实现》黄健宏著

  2. http://redisbook.com/index.html

面试官:你了解过Redis对象底层实现吗的更多相关文章

  1. 面试官:你对Redis缓存了解吗?面对这11道面试题你是否有很多问号?

    前言 关于Redis的知识,总结了一个脑图分享给大家 1.在项目中缓存是如何使用的?为什么要用缓存?缓存使用不当会造成什么后果? 面试官心理分析 这个问题,互联网公司必问,要是一个人连缓存都不太清楚, ...

  2. 面试官问我,Redis分布式锁如何续期?懵了。

    前言 上一篇[面试官问我,使用Dubbo有没有遇到一些坑?我笑了.]之后,又有一位粉丝和我说在面试过程中被虐了.鉴于这位粉丝是之前肥朝的粉丝,而且周一又要开启新一轮的面试,为了回馈他长期以来的支持,所 ...

  3. 【性能优化】面试官:Java中的对象都是在堆上分配的吗?

    写在前面 从开始学习Java的时候,我们就接触了这样一种观点:Java中的对象是在堆上创建的,对象的引用是放在栈里的,那这个观点就真的是正确的吗?如果是正确的,那么,面试官为啥会问:"Jav ...

  4. 阿里P7岗位面试,面试官问我:为什么HashMap底层树化标准的元素个数是8

    前言 先声明一下,本文有点标题党了,像我这样的菜鸡何德何能去面试阿里的P7岗啊,不过,这确实是阿里p7级岗位的面试题,当然,参加面试的人不是我,而是我部门的一个大佬.他把自己的面试经验分享给了我,也让 ...

  5. 女朋友面试回来抱怨说会redis,面试官问了一堆redis

    Redis 优缺点及特点 什么是Redis?简述它的优缺点? Redis本质上是一个Key-Value类型的内存数据库,类似MemoryCache,整个数据库统统加载在内存当中进行操作,定期通过异步操 ...

  6. 面试官:你确定 Redis 是单线程的进程吗?

    作者:小林coding 计算机八股文网站:https://xiaolincoding.com 大家好,我是小林. 这次主要分享 Redis 线程模型篇的面试题. Redis 是单线程吗? Redis ...

  7. 《吊打面试官》系列-Redis哨兵、持久化、主从、手撕LRU

    你知道的越多,你不知道的越多 点赞再看,养成习惯 前言 Redis在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在Redis的使用和原理方面对小伙伴们进行360°的刁难.作为一个在互联 ...

  8. Redis——面试官考题

    总结: 本文在一次面试的过程中讲述了 Redis 是什么,Redis 的特点和功能,Redis 缓存的使用,Redis 为什么能这么快,Redis 缓存的淘汰策略,持久化的两种方式,Redis 高可用 ...

  9. 《吊打面试官》系列-Redis常见面试题(带答案)

    你知道的越多,你不知道的越多 点赞再看,养成习惯 GitHub上已经开源,有面试点思维导图,欢迎[Star]和[完善] 前言 Redis在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在 ...

随机推荐

  1. String中substring方法内存泄漏问题

    众所周知,JDK中以前String类中的substring方法存在内存泄漏问题,之所以说是以前,是因为JDK1.7及以后的版本已经修复了,我看都说JDK1.6的版本也存在这个问题,但是我本机上安装的1 ...

  2. 学好Java只需要做到这7点,年薪20W起步

    大道至简,所以扎实有用的方法,其实都是很简单的,难在踏踏实实的执行过程.今天为大家介绍的就是Java学习的7个看起来非常简单的方法,快学起来吧. 为什么要学习java? Java是目前最流行的编程语言 ...

  3. CMake生成OpenCV解决方案&&编译OpenCV源码

    生成OpenCV工程需要用到CMake,所以第一步需要下载CMake软件,下载链接:CMake下载 目前最新的版本是3.7.1,这里选择下载Platform下的Windows win32-x86 ZI ...

  4. 机器学习:scikit-learn 做笑脸识别 (SVM, KNN, Logisitc regression)

    scikit-learn 是 Python 非常强大的一个做机器学习的包,今天介绍scikit-learn 里几个常用的分类器 SVM, KNN 和 logistic regression,用来做笑脸 ...

  5. oracle备份和升级数据库

    同oracle用户登录数据库驻留server.例如,主文件夹/home./oracle.运行以下命令来执行备份操作. sqlplus /nolog connect /as sysdba sql> ...

  6. SICP 锻炼 (1.40)解决摘要

    SICP 锻炼1.40 是一个休闲的工作非常easy,但它看起来很复杂,单的一道题. 题目原题例如以下: 请定义一个过程cubic, 它和newtons-method过程一起使用在以下形式的表达式里: ...

  7. x86汇编指令脚本虚拟机

    简介 这是一个可以直接解释执行从ida pro里面提取出来的x86汇编代码的虚拟机. 非常精简,整体架构上不能跟那些成熟的虚拟机相比,主要目标是够用.能用.轻量就行,如果觉得代码架构设计的不是很好的话 ...

  8. sql 1=1

    大多数时候是为了sql拼写方便而加的条件从执行任务来看,不影响性能  

  9. You don't have permission to access / on this server问题的解决.

    vhosts.conf配置文件中虚拟主机的配置如下,Options Indexes FollowSymLinks 后面添加 ExecCGI <VirtualHost 192.168.10.82: ...

  10. WPF DataGrid 的RowDetailsTemplate的使用

    <Window x:Class="DataGridExam.DataGridRowDetailsExam"        xmlns="http://schemas ...