C-Store: A Column-oriented DBMS Mike

这篇paper比较老，是列存比较基础的论文

几乎所有列存，或olap的论文都会引用这篇

行存面向写，支持OLTP

列存面向读，支持OLAP

基于磁盘的DBMS，瓶颈基本在磁盘IO，所有做的工作都是用多余的cpu来换取磁盘IO

总体的思路，压缩让需要存的数据更小，densepack，更多的数据一起存，这样会更紧凑？

本论文的创新点，如下

Hybrid架构

这个架构很有借鉴意义，因为一种结构很难同时满足TP和AP的需要

所以用两个系统，一个用于write-optimized，一个用于read-optimized，中间用一个tuple mover进行数据的同步

后续很多列存和ap系统都是用的这种架构

数据模型

这里提出的数据模型，比较有意思

Table只是一个逻辑概念，真正存储的是projections，

projection是columns的集合，并且projection之间是可以overlap的

这其实不就是把一张表，拆成多张表吗？或者可以认为是一种行存和列存的balance？类似Hbase的column family

降低了数据库管理的成本

可以对不同的projection不同的排序，当前不同排序的成本是很高的，需要多存一份数据

数据冗余可以用于数据恢复，因为一个colunm往往在不同的projections中存了多份

避免join，因为这个projection可以包含外表的字段，但是由于表拆的更小了，所以又增加了join的概率，双刃剑

数据压缩

在RS端，需要对数据进行压缩来降低磁盘IO

在WS端，就不需要加压缩了，因为本身数据在memory，而且WS只是cache实时数据，数据量不大

分成4种情况，

自身有序，大量重复，记录length

自身无序，大量重复，bitmap

自身有序，少量重复，记录delta

自身无序，少量重复，无解

并且对于数据value，可以再加上B-tree索引，因为RS是没有更新的，所以索引可以建的非常紧凑，不会有空洞，densepack

Snapshot Isolation

SI的核心问题，是在查询时间ET，我们要决定在WS和RS中哪些records是visible的？

SI，之所以是Snapshot，就是不能update in place，写不影响原来的读

所以update变成，一个insert和一个delete，这样如果我们记录下，insert和delete的时间，然后和ET比较，就可以判断这个record是否可见

这里决定以绝对时间来作为visible的判断，粒度太小，所以提出epoch

所以会保存insertion vector和deleted record vector，记录每个record的insert和delete的epoch

Epoch是什么，

对时间的划分

有个leader TA，会定期发送message，告诉大家可以epoch+1

然后大家会进入下一个epoch，并且等当前epoch的Transaction都结束后，reply到TA

TA收到所有的reply，就会把HWM设为改epoch，然后广播给大家，这样HWM以下的数据都是被读到的

C-Store: A Column-oriented DBMS Mike的更多相关文章

MapReduce的核心资料索引 [转]
转自http://prinx.blog.163.com/blog/static/190115275201211128513868/和http://www.cnblogs.com/jie46583173 ...
资源list：Github上关于大数据的开源项目、论文等合集
Awesome Big Data A curated list of awesome big data frameworks, resources and other awesomeness. Ins ...
Awesome Big Data List
https://github.com/onurakpolat/awesome-bigdata A curated list of awesome big data frameworks, resour ...
Oracle 12.1.0.2 New Feature翻译学习【In-Memory column store内存列存储】【原创】
翻译没有追求信达雅,不是为了学英语翻译,是为了快速了解新特性,如有语义理解错误可以指正.欢迎加微信12735770或QQ12735770探讨oracle技术问题:) In-Memory Column ...
PayPal高级工程总监：读完这100篇论文就能成大数据高手（附论文下载）
100 open source Big Data architecture papers for data professionals. 读完这100篇论文就能成大数据高手作者白宁超 2016年 ...
PayPal 高级工程总监：读完这 100 篇文献，就能成大数据高手
原文地址开源(Open Source)对大数据影响,有二:一方面,在大数据技术变革之路上,开源在众人之力和众人之智推动下,摧枯拉朽,吐故纳新,扮演着非常重要的推动作用:另一方面,开源也给大数据技术构 ...
100 open source Big Data architecture papers for data professionals
zhuan :https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan Big Da ...
CNCF CloudNative Landscape
cncf landscape CNCF Cloud Native Interactive Landscape 1. App Definition and Development 1. Database ...
LIST OF NOSQL DATABASES [currently 150]
http://nosql-database.org Core NoSQL Systems: [Mostly originated out of a Web 2.0 need] Wide Column ...

随机推荐

Flink Time深度解析（转）
Flink 的 API 大体上可以划分为三个层次:处于最底层的 ProcessFunction.中间一层的 DataStream API 和最上层的 SQL/Table API,这三层中的每一层都非常 ...
Executors、ThreadPoolExecutor线程池讲解
官方+白话讲解Executors.ThreadPoolExecutor线程池使用 Executors:JDK给提供的线程工具类,静态方法构建线程池服务ExecutorService,也就是Thread ...
【Linux】linux之如何清理磁盘空间
相关命令: 1.查询磁盘空间占用情况df -h2.进入根目录,查询大文件与目录 cd /du -sh * | sort -n 查看上GB的目录并且排序,可以用这个命令du -h --max-depth ...
springboot 集成百度的唯一ID生成器
UidGenerator是百度开源的Java语言实现,基于Snowflake算法的唯一ID生成器.而且,它非常适合虚拟环境,比如:Docker.另外,它通过消费未来时间克服了雪花算法的并发限制.Uid ...
技术分享 | mysql 表数据校验
1. checksum table. checksum table 会对表一行一行进行计算,直到计算出最终的 checksum 结果.比如对表 n4 进行校验(记录数 157W,大小为 4G) [yt ...
Cobbler本机使用VM装机配置方法
一.需要在本地VM虚拟机上安装好Cobbler服务安装服务及配置方法参见链接:https://www.cnblogs.com/cyleon/p/11460061.html 二.本地配置VM网络网络 ...
K-th Path CodeForces - 1196F
题目链接:https://vjudge.net/problem/CodeForces-1196F 题意:从图中找出第K短的最短路,最短路:从一个点到另一个的最短距离. 思路:题目说了,每两个点之间的边 ...
项目Beta冲刺（团队）——05.27(5/7)
项目Beta冲刺(团队)--05.27(5/7) 格式描述课程名称:软件工程1916|W(福州大学) 作业要求:项目Beta冲刺(团队) 团队名称:为了交项目干杯作业目标:记录Beta敏捷冲刺第5 ...
react的优点：兼容了dsl语法与UI的组件化管理
react的优点:兼容了dsl语法与UI的组件化管理. 组件化管理的dsl描述 UI: 虚拟dom:
理解serverless无服务架构原理(一)
阅读目录一:什么是serverless无服务? 二:与传统模式架构区别? 三:serverless优缺点? 四:使用serverless的应用场景有哪些? 回到顶部一:什么是serverless无 ...

C-Store: A Column-oriented DBMS Mike

C-Store: A Column-oriented DBMS Mike的更多相关文章

随机推荐

热门专题