索引经常使用的数据结构为B+树。结构例如以下

如上图,是一颗b+树,关于b+树的定义能够參见B+树,这里仅仅说一些重点。浅蓝色的块我们称之为一个磁盘块,能够看到每一个磁盘块包括几个数据项(深蓝色所看到的)和指针(黄色所看到的),如磁盘块1包括数据项17和35。包括指针P1、P2、P3。P1表示小于17的磁盘块,P2表示在17和35之间的磁盘块,P3表示大于35的磁盘块。真实的数据存在于叶子节点即3、5、9、10、13、15、28、29、36、60、75、79、90、99。

非叶子节点仅仅不存储真实的数据,仅仅存储指引搜索方向的数据项,如17、35并不真实存在于数据表中。

b+树的查找过程

如图所看到的,假设要查找数据项29,那么首先会把磁盘块1由磁盘载入到内存,此时发生一次IO。在内存中用二分查找确定29在17和35之间,锁定磁盘块1的P2指针,内存时间由于很短(相比磁盘的IO)能够忽略不计,通过磁盘块1的P2指针的磁盘地址把磁盘块3由磁盘载入到内存。发生第二次IO,29在26和30之间,锁定磁盘块3的P2指针。通过指针载入磁盘块8到内存。发生第三次IO,同一时候内存中做二分查找找到29,结束查询,总计三次IO。

真实的情况是,3层的b+树能够表示上百万的数据。假设上百万的数据查找仅仅须要三次IO,性能提高将是巨大的,假设没有索引,每一个数据项都要发生一次IO,那么总共须要百万次的IO。显然成本很很高。

b+树性质

1.通过上面的分析,我们知道IO次数取决于b+数的高度h。假设当前数据表的数据为N,每一个磁盘块的数据项的数量是m,则有h=㏒(m+1)N,当数据量N一定的情况下,m越大,h越小。而m = 磁盘块的大小 / 数据项的大小。磁盘块的大小也就是一个数据页的大小,是固定的。假设数据项占的空间越小,数据项的数量越多,树的高度越低。

这就是为什么每一个数据项,即索引字段要尽量的小,比方int占4字节,要比bigint8字节少一半。这也是为什么b+树要求把真实的数据放到叶子节点而不是内层节点,一旦放到内层节点,磁盘块的数据项会大幅度下降。导致树增高。当数据项等于1时将会退化成线性表。

2.当b+树的数据项是复合的数据结构,比方(name,age,sex)的时候,b+数是依照从左到右的顺序来建立搜索树的。比方当(张三,20,F)这种数据来检索的时候。b+树会优先比較name来确定下一步的所搜方向。假设name同样再依次比較age和sex。最后得到检索的数据。但当(20,F)这种没有name的数据来的时候,b+树就不知道下一步该查哪个节点,由于建立搜索树的时候name就是第一个比較因子,必须要先依据name来搜索才干知道下一步去哪里查询。

比方当(张三,F)这种数据来检索时。b+树能够用name来指定搜索方向,但下一个字段age的缺失,所以仅仅能把名字等于张三的数据都找到,然后再匹配性别是F的数据了。 这个是很重要的性质,即索引的最左匹配特性。

建索引的几大原则

1.最左前缀匹配原则,很重要的原则。mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比方a = 1 and b = 2 and c > 3 and d = 4 假设建立(a,b,c,d)顺序的索引,d是用不到索引的。假设建立(a,b,d,c)的索引则都能够用到,a,b,d的顺序能够随意调整。

2.=和in能够乱序,比方a = 1 and b = 2 and c = 3 建立(a,b,c)索引能够随意顺序。mysql的查询优化器会帮你优化成索引能够识别的形式

3.尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不反复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问。这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般须要join的字段我们都要求是0.1以上,即平均1条扫描10条记录

4.索引列不能參与计算,保持列“干净”。比方from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很easy,b+树中存的都是数据表中的字段值,但进行检索时,须要把全部元素都应用函数才干比較,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);

5.尽量的扩展索引,不要新建索引。比方表中已经有a的索引,如今要加(a,b)的索引。那么仅仅须要改动原来的索引就可以

mysql优化之索引建立的规则的更多相关文章

  1. mysql 优化之索引的使用

    mysql 优化之索引的使用 1:MySQL 索引简介: MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度. 打个比方,如果合理的设计且使用索引的MySQL ...

  2. 【Mysql优化】索引优化策略

    1:索引类型 1.1 B-tree索引 注: 名叫btree索引,大的方面看,都用的平衡树,但具体的实现上, 各引擎稍有不同, 比如,严格的说,NDB引擎,使用的是T-tree   Myisam,in ...

  3. mysql优化之索引篇

    对mysql优化是一个综合性的技术,主要包括 a: 表的设计合理化(符合3NF) b: 添加适当索引(index) [四种: 普通索引.主键索引.唯一索引unique.全文索引] c: 分表技术(水平 ...

  4. mysql优化之索引优化

    Posted by Money Talks on 2012/02/23 | 第一篇 序章第二篇 连接优化第三篇 索引优化第四篇 查询优化第五篇 到实战中去 索引优化 索引优化涉及到几个方面,包括了索引 ...

  5. Mysql优化之索引和字段

    Mysql优化是一个老生常谈的问题, 优化的方向也优化很多:从架构层;从设计层;从存储层;从SQL语句层; 今天讲解一下从索引和字段: 字段优化: ①  尽量使用TINYINT.SMALLINT.ME ...

  6. MySQL优化之索引解析

    索引的本质 MySQL索引或者说其他关系型数据库的索引的本质就只有一句话,以空间换时间. 索引的作用 索引关系型数据库为了加速对表中行数据检索的(磁盘存储的)数据结构 索引的分类 数据结构上面的分类 ...

  7. 第九课——MySQL优化之索引和执行计划

    一.创建索引需要关注什么? 1.关注基数列唯一键的数量: 比如性别,该列只有男女之分,所以性别列基数是2: 2.关注选择性列唯一键与行数的比值,这个比值范围在0~1之前,值越小越好: 其实,选择性列唯 ...

  8. MySQL优化之索引原理(二)

    一,前言 ​ 上一篇内容说到了MySQL存储引擎的相关内容,及数据类型的选择优化.下面再来说说索引的内容,包括对B-Tree和B+Tree两者的区别. 1.1,什么是索引 ​ 索引是存储引擎用于快速找 ...

  9. MySQL优化四 索引优化

    索引为什么能提高数据访问性能? 很多人只知道索引能够提高数据库的性能,但并不是特别了解其原理,其实我们可以用一个生活中的示例来理解. 我们让一位不太懂计算机的朋友去图书馆确认一本叫做<MySQL ...

随机推荐

  1. iOS学习笔记36-Masonry自动布局

    一.Masonry介绍 之前我们在屏幕适配的章节中学习过AutoLayout的使用,但那都是在可视化界面上进行添加约束完成的,我们很多时候都需要在代码中使用AutoLayout约束,苹果也为我们提供了 ...

  2. 关于pymongo的一些说明

    问题 一: 在pymongo中使用find是得到1个游标对象的,如果你想实现MongoDB shell中find操作,例如: > db.test.find() { "_id" ...

  3. 为了防止detailsview中修改后,而girdview却没立即更新显示

    原文发布时间为:2008-07-30 -- 来源于本人的百度文章 [由搬家工具导入] 可以在detailsview的事件中添加如下语句,即增加一个头,让它在0秒的时候刷新: Response.AddH ...

  4. 长度rem的使用

    <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...

  5. 升级 GCC 支持C++11 或 configure: error: *** A compiler with support for C++11 language features is required.

    configure: error: *** A compiler with support for C++11 language features is required. 参考链接: (1)升级 G ...

  6. 洛谷——P2737 [USACO4.1]麦香牛块Beef McNuggets

    https://www.luogu.org/problemnew/show/P2737 题目描述 农夫布朗的奶牛们正在进行斗争,因为它们听说麦当劳正在考虑引进一种新产品:麦香牛块.奶牛们正在想尽一切办 ...

  7. IP分段小记

    192.168.0.1 个人电脑:0.2-0.50 硬件开发板:0.51-0.100 机器人工控机:0.101-0.200 激光雷达:192.168.254.51~100 编码器板子:192.168. ...

  8. POJ 3140 Contestants Division (树dp)

    题目链接:http://poj.org/problem?id=3140 题意: 给你一棵树,问你删去一条边,形成的两棵子树的节点权值之差最小是多少. 思路: dfs #include <iost ...

  9. Java开发笔记(一百零二)信号量的请求与释放

    前面介绍了同步与加锁两种并发处理机制,虽然加锁比起同步要灵活一些,但是加锁在某些高级场合依然力有未逮,包括但不限于下列几点:1.某块代码被加锁之后,对其它线程而言就处于繁忙状态,缺乏弹性的阈值范围:2 ...

  10. 手机微硬盘读取速度>50MB/s eMMC技术浅析

    转载:http://mobile.zol.com.cn/296/2968659_all.html#p2968659 手机微硬盘读取速度>50MB/s 在开始今天的话题之前,请大家随笔者一起时光倒 ...