Red KV数据庫设計模式

转:http://blog.nosqlfan.com/html/3033.html

NoSQL带给我们的东西很多，高性能，水平扩展性，还有不一样的思维方式。本文来自@hoterran的个人博客运维与开发，作者列举了几种常用的应用场景，分别描述了其关系型数据库和Redis下的不同存储设计方法。值得参考。

丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。

下面举一些常见适合kv数据库的例子来谈谈键值的设计，并与关系型数据库做一个对比，发现关系型的不足之处。

用户登录系统

记录用户登录信息的一个系统，我们简化业务后只留下一张表。

关系型数据库的设计
mysql> select * from login;

+---------+----------------+-------------+---------------------+

| user_id | name           | login_times | last_login_time     |

+---------+----------------+-------------+---------------------+

|       1 | ken thompson   |           5 | 2011-01-01 00:00:00 |

|       2 | dennis ritchie |           1 | 2011-02-01 00:00:00 |

|       3 | Joe Armstrong  |           2 | 2011-03-01 00:00:00 |

+---------+----------------+-------------+---------------------+
user_id表的主键，name表示用户名，login_times表示该用户的登录次数，每次用户登录后，login_times会自增，而last_login_time更新为当前时间。

REDIS的设计

关系型数据转化为KV数据库，我的方法如下：

key 表名：主键值：列名

value 列值

一般使用冒号做分割符，这是不成文的规矩。比如在php-admin for redis系统里，就是默认以冒号分割，于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下：
Set login:1:login_times 5

Set login:2:login_times 1

Set login:3:login_times 2

Set login:1:last_login_time 2011-1-1

Set login:2:last_login_time 2011-2-1

Set login:3:last_login_time 2011-3-1

set login:1:name ”ken thompson“

set login:2:name “dennis ritchie”

set login:3:name ”Joe Armstrong“
这样在已知主键的情况下，通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。

一般用户是无法知道自己的id的，只知道自己的用户名，所以还必须有一个从name到id的映射关系，这里的设计与上面的有所不同。
set "login:ken thompson:id"      1

set "login:dennis ritchie:id"    2

set "login: Joe Armstrong:id"    3
这样每次用户登录的时候业务逻辑如下（python版），r是redis对象，name是已经获知的用户名。
#获得用户的id

uid = r.get("login:%s:id" % name)

#自增用户的登录次数

ret = r.incr("login:%s:login_times" % uid)

#更新该用户的最后登录时间

ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())
如果需求仅仅是已知id，更新或者获取某个用户的最后登录时间，登录次数，关系型和kv数据库无啥区别。一个通过btree pk，一个通过hash，效果都很好。

假设有如下需求，查找最近登录的N个用户。开发人员看看，还是比较简单的，一个sql搞定。
select * from login order by last_login_time desc limit N
DBA了解需求后，考虑到以后表如果比较大，所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录，再回表N次，效果很好。

过了两天，又来一个需求，需要知道登录次数最多的人是谁。同样的关系型如何处理？DEV说简单
select * from login order by login_times desc limit N
DBA一看，又要在login_time上建立一个索引。有没有觉得有点问题呢，表上每个字段上都有素引。

关系型数据库的数据存储的的不灵活是问题的源头，数据仅有一种储存方法，那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的，而访问路径的增加又意味着你必须使用统计信息来辅助，于是一大堆的问题就出现了。

没有索引，没有统计计划，没有执行计划，这就是kv数据库。

redis里如何满足以上的需求呢？对于求最新的N条数据的需求，链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码，维护一个登录的链表，控制他的长度，使得里面永远保存的是最近的N个登录用户。
#把当前登录人添加到链表里

ret = r.lpush("login:last_login_times", uid)

#保持链表只有N位

ret = redis.ltrim("login:last_login_times", 0, N-1)
这样需要获得最新登录人的id，如下的代码即可
last_login_list = r.lrange("login:last_login_times", 0, N-1)
另外，求登录次数最多的人，对于排序，积分榜这类需求，sorted set非常的适合，我们把用户和登录次数统一存储在一个sorted set里。
zadd login:login_times 5 1

zadd login:login_times 1 2

zadd login:login_times 2 3
这样假如某个用户登录，额外维护一个sorted set，代码如此
#对该用户的登录次数自增1

ret = r.zincrby("login:login_times", 1, uid)
那么如何获得登录次数最多的用户呢，逆序排列取的排名第N的用户即可
ret = r.zrevrange("login:login_times", 0, N-1)
可以看出，DEV需要添加2行代码，而DBA不需要考虑索引什么的。

TAG系统

tag在互联网应用里尤其多见，如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。

关系型数据库的设计

两张表，一张book的明细，一张tag表，表示每本的tag，一本书存在多个tag。
mysql> select * from book;

+------+-------------------------------+----------------+

| id   | name                          | author         |

+------+-------------------------------+----------------+

|    1 | The Ruby Programming Language | Mark Pilgrim   |

|    1 | Ruby on rail                  | David Flanagan |

|    1 | Programming Erlang            | Joe Armstrong  |

+------+-------------------------------+----------------+

mysql> select * from tag;

+---------+---------+

| tagname | book_id |

+---------+---------+

| ruby    |       1 |

| ruby    |       2 |

| web     |       2 |

| erlang  |       3 |

+---------+---------+

假如有如此需求，查找即是ruby又是web方面的书籍，如果以关系型数据库会怎么处理？
select b.name, b.author  from tag t1, tag t2, book b

where t1.tagname = 'web' and t2.tagname = 'ruby' and t1.book_id = t2.book_id and b.id = t1.book_id
tag表自关联2次再与book关联，这个sql还是比较复杂的，如果要求即ruby，但不是web方面的书籍呢？

关系型数据其实并不太适合这些集合操作。

REDIS的设计

首先book的数据肯定要存储的，和上面一样。
set book:1:name    ”The Ruby Programming Language”

Set book:2:name     ”Ruby on rail”

Set book:3:name     ”Programming Erlang”

set book:1:author    ”Mark Pilgrim”

Set book:2:author     ”David Flanagan”

Set book:3:author     ”Joe Armstrong”
tag表我们使用集合来存储数据，因为集合擅长求交集、并集
sadd tag:ruby 1

sadd tag:ruby 2

sadd tag:web 2

sadd tag:erlang 3
那么，即属于ruby又属于web的书？
inter_list = redis.sinter("tag.web", "tag:ruby")
即属于ruby，但不属于web的书？
inter_list = redis.sdiff("tag.ruby", "tag:web")
属于ruby和属于web的书的合集？
inter_list = redis.sunion("tag.ruby", "tag:web")
简单到不行阿。

从以上2个例子可以看出在某些场景里，关系型数据库是不太适合的，你可能能够设计出满足需求的系统，但总是感觉的怪怪的，有种生搬硬套的感觉。

尤其登录系统这个例子，频繁的为业务建立索引。放在一个复杂的系统里，ddl（创建索引）有可能改变执行计划。导致其它的sql采用不同的执行计划，业务复杂的老系统，这个问题是很难预估的，sql千奇百怪。要求DBA对这个系统里所有的sql都了解，这点太难了。这个问题在oracle里尤其严重，每个DBA估计都碰到过。对于MySQL这类系统，ddl又不方便（虽然现在有online ddl的方法）。碰到大表，DBA凌晨爬起来在业务低峰期操作，这事我没少干过。而这种需求放到redis里就很好处理，DBA仅仅对容量进行预估即可。

未来的OLTP系统应该是kv和关系型的紧密结合。

Red KV数据庫设計模式的更多相关文章

java-設計模式概述
什麽是設計模式?? 软件设计中常见问题的典型解决方案. 能根据需求进行调整的预制蓝图, 可用于解决代码中反复出现的设计问题. 模式并不是一段特定的代码, 而是解决特定问题的一般性概念. 你可以根据模式 ...
java-設計模式-單例模式
單例模式一种创建型设计模式, 让你能够保证一个类只有一个实例, 并提供一个访问该实例的全局节点. 一个类只有一个实例,且该类能自行创建这个实例的一种模式. 簡單的對比就是: 例如,Windows 中 ...
数据持久化以及DAO模式的简单使用
持久化:(是将程序中的数据在瞬时状态和持久状态间转换机制) 即把数据(如内存中的对象)保存到可永久保存的存储设备中(如磁盘).持久化的主要应用是将内存中的对象存储在关系型的数据库中,当然 ...
Golang package轻量级KV数据缓存——go-cache源码分析
作者:Moon-Light-Dream 出处:https://www.cnblogs.com/Moon-Light-Dream/ 转载:欢迎转载,但未经作者同意,必须保留此段声明:必须在文章中给出原文 ...
搞懂：MVVM模型以及VUE中的数据绑定数据劫持发布订阅模式
搞懂:MVVM模式和Vue中的MVVM模式 MVVM MVVM : model - view - viewmodel的缩写,说都能直接说出来 model:模型,view:视图,view-Model:视 ...
Android Activity传递数据使用getIntent()接收不到，揭秘Intent传递数据与Activity启动模式singleTask的关系。
activity通过intent传递数据的时候,如果activity未启动,那么在这个刚启动的activity里通过getIntent()会获取到这个intent的数据.. 如果要启动的activit ...
Zookeeper学习(八)：Zookeeper的数据发布与订阅模式
http://blog.csdn.net/ZuoAnYinXiang/article/category/6104448 1.发布订阅的基本概念 1.发布订阅模式可以看成一对多的关系:多 ...
【C/C++开发】内存对齐(内存中的数据对齐)、大端模式及小端模式
数据对齐,是指数据所在的内存地址必须是该数据长度的整数倍.DWORD数据的内存起始地址能被4除尽,WORD数据的内存起始地址能被2除尽.X86 CPU能直接访问对齐的数据,当它试图访问一个未对齐的数据 ...
mysql基础-数据类型和sql模式-学习之(三)
0x01 mysql的两种方向: 开发DBA:数据库设计(E-R关系图).sql开发.内置函数.存储历程(存储过程和存储函数).触发器.时间调度器(event scheduler) 运维----> ...

随机推荐

Java 初学记录之一快速输入
1. sysout 按回车 System.out.println();
android开子线程避免出现main错误
Runnable SonThread=new Runnable() { @Override public void run() { // TODO Auto-generated method stub ...
linux网络协议
网络协议本章节主要介绍linxu网络模型.以及常用的网络协议分析以太网协议.IP协议.TCP协议.UDP协议一.网络模型 TCP/IP分层模型的四个协议层分别完成以下的功能: 第一层网络接口层 ...
winedt打开.tex文件时会出现reading error，看不到任何文字
winedt打开.tex文件时会出现reading error,然后看不到任何文字. 解决办法:先打开空白的winedt,然后点击open,找到该.tex文件,将文件名右侧的 default 改为 ...
Eclipse·如何关联Git库文件和添加JUint库
Eclipse创建工程并关联到文件(SVN或Git管理的代码文件) 新建java工程,用于存放工程的一些信息,默认存放地址. 工程相关的信息是不需要提交到(SVN或Git)版本库的,所以工程存放到本地 ...
Codeforces Round #370 (Div. 2) D. Memory and Scores DP
D. Memory and Scores Memory and his friend Lexa are competing to get higher score in one popular c ...
安装PIL
本来直接pip install PIL的,一直说找不到对应的版本,在廖雪峰老师的博客里发现原来PIL只更新到pytyon 2.7 后来就只有Pillow了,而我的版本是2.7.9 用的时候直接from ...
经典贪心算法uva11729
uva11729 这个题的题意是你有n个部下,每个部下需要完成一项任务.第i个部下需要你花Bi分钟交代任务,然后他会立刻独立地.无间断地执行Ji分钟后完成任务. 你需要选择交待任务的顺序,使得所有任 ...
[BZOJ2599][Race][IOI2011]点分治
这是为了真正去学一下点分治..然后看了迪克李的ppt 又是一道写(改)了很久的题..终于ac了 1354799 orzliyicheng 2599 Accepted 31936 kb 23584 ms ...
Python基础5- 运算符
Python的运算符和其他语言的类似,主要有:算术运算符.比较运算符.逻辑运算符.赋值运算符.成员运算符.位运算符 ----------------------------------------算术 ...

Red KV数据 庫设計模式

用户登录系统

关系型数据库的设计

REDIS的设计

TAG系统

关系型数据库的设计

REDIS的设计

Red KV数据 庫设計模式的更多相关文章

随机推荐

热门专题

Red KV数据庫设計模式

Red KV数据庫设計模式的更多相关文章