Access Path–数据访问方法

在执行联表操作之前先要获取数据。现在讲一下获取数据有哪些方式。

Note:由于所有获取数据方式的关键都是磁盘I/O，所以我不会在这讨论时间复杂度的问题。

Full scan–全表扫描

如果你曾经阅读过介绍SQL执行方案的文档，你一定已知道full scan这个概念。

full scan是数据库将整张表的数据或者索引读取到内存。从磁盘I/O消耗来说，

全表数据扫描的成本明显比全表索引扫描要高很多。

Range Scan –区段扫描

还有其它的一些扫描方式，如：索引区段扫描。它用在数值范围做查询条件的时候(例如：WHERE AGE > 20 AND AGE <40)。当然，你必须得为AGE字段建立了索引才能使用索引区段扫描。

我们已在第一章讲了，区间查询的时间复杂度是log(N) +M，其中N是建立索引的数据条数，M是区间内的数据条数。M和N的值已经在数据特征统计时计算出来了(Note：M是条件断言AGE >20 AND AGE<40的可选元素)。对于区段扫描你甚者不需要读取全部的索引数据，因此它的磁盘I/O成本比全表数据扫描小得多。

Unique scan–唯一值扫描

当你仅需要查询指定索引的单条记录，你可以使用唯一值扫描。

Access by row id–根据行ID获取(数据）

大多数情况，如果数据库建立了索引，它将查询与索引关联的行记录，它将使用行ID去获取数据。

例如下面的SQL语句：

如果你已对person表的age字段建了索引，优化器将使用索引找到所有age是28(的行ID)，然后从表中查询出对应的行数据记录。索引仅包含了age信息，你需要的是lastname和firstname，这些需要从原表中去拿。

但是，如果你执行下面的SQL：

SELECT TYPE_PERSON.CATEGORY from PERSON ,TYPE_PERSON
WHERE PERSON.AGE = TYPE_PERSON.AGE

PERSON表的索引将用于与TYPE_PERSON表做关联，但不会用row id去查询数据，因为不需要查PERSON表中的其它信息。

在需要查询少量数据的时候没什么问题。关键的瓶颈在磁盘I/O，如果你需要根据row id查询太多数据，数据库可能会使用全表数据扫描(代替)。

Others paths–其它方法

我并未介绍所有的数据获取方式。你想了解更多可以阅读oracle官方文档。

上面讲的获取方式名称，在不同的数据库中可能有不同的叫法，但是背后的含义是一致的。

关系型数据库工作原理-查询优化器之数据访问方式(翻译自Coding-Geek文章)的更多相关文章

关系型数据库工作原理-查询优化器之索引(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>.原文链接:http://coding-geek.com/how-data ...
关系型数据库工作原理-查询优化器(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>.原文链接:http://coding-geek.com/how-data ...
关系型数据库工作原理-归并排序(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-时间复杂度(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-事务管理(一)(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-高速缓存(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-事务管理(二)(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-快速缓存(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>. 原文链接:http://coding-geek.com/how-dat ...
关系型数据库工作原理-数据特征统计分析(翻译自Coding-Geek文章)
本文翻译自Coding-Geek文章:< How does a relational database work>.原文链接:http://coding-geek.com/how-data ...

随机推荐

Vijos 1404 遭遇战
Vijos 1404 遭遇战背景你知道吗,SQ Class的人都很喜欢打CS.(不知道CS是什么的人不用参加这次比赛). 描述今天,他们在打一张叫DUSTII的地图,万恶的恐怖分子要炸掉藏在A区 ...
Python逻辑运算符
逻辑运算符主要用来做逻辑判断,逻辑运算符和比较运算符放一起的,同样用于条件选择和循环. 以下假设变量 a 为 10, b为 20: 示例1: #and是并且,所有的条件都是True,结果才是True: ...
centos 配置 php 执行shell的权限
在执行特定的shell命令,如 kill,killall 等需要配置root权限 php脚本运行在apache服务器下可以看到 httpd 是以 apache 用户执行的看一下该用户信息现在 ...
SDP（7）：Cassandra- Cassandra-Engine：Streaming
akka在alpakka工具包里提供了对cassandra数据库的streaming功能.简单来讲就是用一个CQL-statement读取cassandra数据并产生akka-stream的Sourc ...
Json对象与Json字符串互转(4种转换方式)（转）
1>jQuery插件支持的转换方式: $.parseJSON( jsonstr ); //jQuery.parseJSON(jsonstr),可以将json字符串转换成json对象 2> ...
Linux常用命令详解(二) -- 查找常用命令
locate: 作用:在后台数据库中按文件名搜索,搜索速度更快命令格式:locate 文件名选项或参数: -l num(要显示的行数) ...
hbase优化之region合并和压缩
HBASE操作:(一般先合并region然后再压缩) 一 .Region合并: merge_region 'regionname1','regionname2' ,'true' --true代表 ...
python_crawler,批量下载文件
这个第一个python3网络爬虫,参考书籍是<python网络数据采集>.该爬虫的主要功能是爬取某个网站,并将.rar,.doc,.docx,.zip文件批量下载. 后期将要改进的是,用后 ...
1.5 PCI-X总线简介
PCI-X总线仍采用并行总线技术.PCI-X总线使用的大多数总线事务基于PCI总线,但是在实现细节上略有不同.PCI-X总线将工作频率提高到533MHz,并首先引入了PME(Power Managem ...
CAN总线基础知识（二）
CAN协议和标准规范 1 由ISO标准化的CAN协议 CAN协议已经由ISO标准化,有2个版本,如ISO11898和ISO11519-2,它们之间在数据链路层没什么不同,但是在物理层有些区别. (1) ...

关系型数据库工作原理-查询优化器之数据访问方式(翻译自Coding-Geek文章)