学习笔记-db

异步，最终一致性，幂等操作

关系型数据库隔离了数据的存储路径，让用户只关心查询的逻辑，为了实现事物和强一致性通过各种锁牺牲了性能

互联网在线处理需求排列

数据的扩展性 > 请求的响应时间 > down机时间 > 成本 > 快速自动恢复 > 数据的读取一致性 > 开发相关

多机事物多机join 分布式索引

预写日志WAL，队列记录了每次的写操作（用户的一次写操作可能对应计算机内的多步操作），利用操作系统的院子操作fsync()将一小段数据写入磁盘，保证数据不丢失

触发器都是同步的，只有写入数据操作和触发器操作都执行完了才算结束

关系表叫T，有三个行组成 pk，cash，col2

映射的key是pk的值，value则是cash+col2的组合：

那么，select * from T where pk＝ 100020这个查询就可以被转译成一个非常简单的针对映射的操作了，map.get(100020)

sql解析器 => 执行优化器 => 锁 => 映射[读取主数据] =>触发器[触发读取事件] =>锁[释放读锁]

select * from T where cash＝ 100

建立一个新的映射关系idx_cash，针对原有T表中部分数据的重排，key是cash，value则是pk。主索引或一级索引是PK为key的数据，非PK为key的数据成为二级索引或辅助索引。当执行查询时，先查辅助索引idx_cash，以logN的复杂度找到一批pk数据，然后再去住索引中按照pk去找到记录。

sql解析器 => 执行优化器 => 锁[申请读锁(或使用MVCC)] => 映射[读取二级索引] => 映射[读取主数据] =>触发器[触发读取事件] =>锁[释放读锁]

insert into T (pk,cash,col2) values (100,10,20)

sql解析器 => 执行优化器 => 锁[申请写锁，同时锁住主数据和辅助索引数据] => 映射[读取主索引，判断该值是否存在] =>预写式日志[写入数据日志]=> 映射[写入数据，如果不存在] =>触发器[触发写入事件] => 映射[根据触发器，更新二级索引] => 触发器[触发二级索引写入事件] =>预写式日志[标记该条记录全部写入完成]=>锁[释放写锁]

begin transaction ;

预写式日志[声明一个事务的唯一标记]

select cash from T where pk = 1;

sql解析器 => 执行优化器 => 锁[申请读锁] => 映射[读取主数据] =>触发器[触发读取事件]

update T set cash = cach-100 where pk = 1;

sql解析器 => 执行优化器 => 锁[读锁升级为写锁] => 映射[读取主数据pk=1] => 预写式日志[写入数据日志，添加事务的唯一标记] => 映射[写入数据] =>触发器[触发写入事件] => 映射[根据触发器，更新二级索引] => 触发器[触发二级索引写入事件]

update T set cach = cash+100 where pk =2;

sql解析器 => 执行优化器 => 锁[读锁升级为写锁] => 映射[读取主数据pk=2] => 预写式日志[写入数据日志，添加事务的唯一标记] => 映射[写入数据] =>触发器[触发写入事件] => 映射[根据触发器，更新二级索引] => 触发器[触发二级索引写入事件]

commit;

预写式日志[标明该事务提交]

DB磁盘读写优化：一次性读取或写入固定大小的一块数据，并尽可能的减少随机寻道这个操作的次数

B树原位写入：查找到当前数据对应块的位置（找到某个块【数据块包含了一组个数有限的有序数据】，检查主键约束，是否需要分裂），然后将新数据写入到刚才找到的数据块，然后再查找到块所对应的磁盘物理位置，将数据写入。假定内存只能容纳一个B树块大小的数据，操作需要两次随机寻道（一次查找，一次原位写）

EG: 现有块 0，1，2|3，4，5|6，7，9 ，写入8

先找到块6，7，9 ==> 放不下，分裂为两个块 ==> 写出后变为 0，1，2|3，4，5|6，7，空|8，9，空

内存满了之后如何将数据写回磁盘

1. 原位写入（Innodb），不浪费空间，保证查询O（log2n）

2. 队尾写入，不做原位替换，只将新写入的数据追加到整个数据的尾部，加快写入速度，缺点是老值还在原数据块中，占用了额外的空间。树1:0，1，2|3，4，5|6，7，9; 树2:5'，8，9'

读取最新值：

A. 每次将内存中的树和硬盘中的树做合并后写到新位置，并更新父节点的指针--磁盘增删次数多了导致磁盘空洞，随机跳跃存在，对范围查询不友好，读取的随机IO增加

B. 内存中存在一个或者多个有序树结构，读取根据时间顺序倒着去多个树种一次查找，结果第一个找到的就是最新值。

空间浪费：

后台开一个线程，利用异步归并排序的方式将多个小的有序树进行合并后追加。因为是异步并且写出来的数据也是有序的，所以也尽可能降低磁盘寻到次数

树1：0，1，2|3，4，5|6，7，9; 树2:5'，8，9' ; 树3:0，1，2|3，4，5'|6，7，8|9'，此时树3已经包含了树1.2，删除他俩即可。

LSM Tree（log structured merge tree），针对传统b树在磁盘写入性能上的优化。放弃部分读能力换取写入能力的最大化。假定内存足够大，不需要每次更新都写入磁盘，可以先将最新的数据驻留在磁盘中，等积累到一定程度，再用归并方式将内存数据合并追加到磁盘队尾

SSTable/Merge-dump模型的LSMTree: 避免写入太多，内存不够，所以定期将内存数据刷写到磁盘尾部并清空内存，通过良好的缓存和compaction机制以及适当的bloom-filter可以降低对读效率的影响

学习笔记-db的更多相关文章

rails学习笔记: rake db 相关命令
rails学习笔记: rake db 命令行 rake db:*****script/generate model task name:string priority:integer script/g ...
Linux 学习笔记
Linux学习笔记请切换web视图查看,表格比较大,方法:视图>>web板式视图博客园不能粘贴图片吗 http://wenku.baidu.com/view/bda1c3067fd53 ...
MongoDB学习笔记—权限管理
1.MongoDB权限介绍 a 上篇文章中,我们在Linux下配置了MongoDB环境并且将其设置为服务随机器启动而启动,那么接下来这篇文章我们就来简单说一下MongoDB下对登录用户权限的管理. b ...
MongoDB学习笔记~环境搭建
回到目录 Redis学习笔记已经告一段落,Redis仓储也已经实现了,对于key/value结构的redis我更愿意使用它来实现数据集的缓存机制,而对于结构灵活,查询效率高的时候使用redis就有点不 ...
Redis学习笔记4-Redis配置详解
在Redis中直接启动redis-server服务时, 采用的是默认的配置文件.采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务.按照本Redi ...
linq学习笔记
最近在学习linq的一些基础知识,看了c#高级编程及阅读了园子内部几篇优秀的博文,有所体会,感觉应该记录下来,作为以后复习使用.都是一些最基础的知识,大致分为三个部分:linq预备知识:linq查询: ...
[原创]java WEB学习笔记109：Spring学习---spring中事物管理
博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱好 ...
[原创]java WEB学习笔记109：Spring学习---spring对JDBC的支持：使用 JdbcTemplate 查询数据库，简化 JDBC 模板查询，在 JDBC 模板中使用具名参数两种实现
本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...
X-Cart 学习笔记（二）X-Cart框架1
目录 X-Cart 学习笔记(一)了解和安装X-Cart X-Cart 学习笔记(二)X-Cart框架1 X-Cart 学习笔记(三)X-Cart框架2 X-Cart 学习笔记(四)常见操作四.X- ...

随机推荐

php比较全的友好时间显示
分享一个php友好的比较完成的时间格式化函数,包括‘刚刚’,'几秒之前',‘几分钟前’,'几小时前',几天前,几周前,几个月前等.调用方式很简单,是从ThinkSNS 里面拿出来的. /** * 友好 ...
asp.net 模拟CURL调用微信公共平台API 上传下载多媒体文
近公司项目上在开发微信服务号的接口,需要给用户回复图片或语音或视频,这个时候就需要用到上传下载多媒体文件接口,微信在这方面推荐采用的是开源函数库curl实现的,CURL项目包括很多版本,我主要测试的 ...
svn 提交代码自动过滤技巧,自动过滤不想提交的文件和文件夹
原文:http://www.cnblogs.com/codealone/p/3208620.html 打开SVN客户端-----常规设置------全局忽略样式,添加 bin obj debug Re ...
【Hibernate学习笔记-4】在hibernate.cfg.xml中配置C3P0数据源
jar包 hibernate.cfg.xml <?xml version="1.0" encoding="GBK"?> <!DOCTYPE h ...
求两点之间距离 C++
求两点之间距离(20 分) 定义一个Point类,有两个数据成员:x和y, 分别代表x坐标和y坐标,并有若干成员函数. 定义一个函数Distance(), 用于求两点之间的距离.输入格式: 输入有两行 ...
mysql分区表之三：MySQL分区建索引[转]
介绍 mysql分区后每个分区成了独立的文件,虽然从逻辑上还是一张表其实已经分成了多张独立的表,从“information_schema.INNODB_SYS_TABLES”系统表可以看到每个分区都存 ...
PHP PDO prepare()、execute()和bindParam()方法详解
每次将查询发送给MySQL服务器时,都必须解析该查询的语法,确保结构正确并能够执行.这是这个过程中必要的步骤,但也确实带来了一些开销.做一次是必要的,但如果反复地执行相同的查询,批量插入多行并只改变列 ...
Python 编程规范梳理
缘由由于项目团队中新加入了几名攻城狮, 大家之前的背景各不相同,写出的代码也是“风格迥异”.正所谓:“无规则不成方圆”,因此需要对编程进行必要的规范. 整体的思路是:依照PEP8 Python 编码 ...
python的类
一.语法 python类的机制是 C++ 的类机制和 Modula-3 的类机制的混合体: 允许多继承的类继承机制,派生类可以重写它父类的任何方法,一个方法可以调用父类中重名的方法: 1.动态特性: ...
centos 7.x设置守护进程的文件数量限制
在Bash中有个ulimit命令,提供了对Shell及该Shell启动的进程的可用资源控制.主要包括打开文件描述符数量.用户的最大进程数量.coredump文件的大小等. 1. 系统级设置 1.1 C ...

学习笔记-db

学习笔记-db的更多相关文章

随机推荐

热门专题