索引经常使用的数据结构为B+树。结构例如以下

如上图,是一颗b+树,关于b+树的定义能够參见B+树,这里仅仅说一些重点。浅蓝色的块我们称之为一个磁盘块,能够看到每一个磁盘块包括几个数据项(深蓝色所看到的)和指针(黄色所看到的),如磁盘块1包括数据项17和35。包括指针P1、P2、P3。P1表示小于17的磁盘块,P2表示在17和35之间的磁盘块,P3表示大于35的磁盘块。真实的数据存在于叶子节点即3、5、9、10、13、15、28、29、36、60、75、79、90、99。

非叶子节点仅仅不存储真实的数据,仅仅存储指引搜索方向的数据项,如17、35并不真实存在于数据表中。

b+树的查找过程

如图所看到的,假设要查找数据项29,那么首先会把磁盘块1由磁盘载入到内存,此时发生一次IO。在内存中用二分查找确定29在17和35之间,锁定磁盘块1的P2指针,内存时间由于很短(相比磁盘的IO)能够忽略不计,通过磁盘块1的P2指针的磁盘地址把磁盘块3由磁盘载入到内存。发生第二次IO,29在26和30之间,锁定磁盘块3的P2指针。通过指针载入磁盘块8到内存。发生第三次IO,同一时候内存中做二分查找找到29,结束查询,总计三次IO。

真实的情况是,3层的b+树能够表示上百万的数据。假设上百万的数据查找仅仅须要三次IO,性能提高将是巨大的,假设没有索引,每一个数据项都要发生一次IO,那么总共须要百万次的IO。显然成本很很高。

b+树性质

1.通过上面的分析,我们知道IO次数取决于b+数的高度h。假设当前数据表的数据为N,每一个磁盘块的数据项的数量是m,则有h=㏒(m+1)N,当数据量N一定的情况下,m越大,h越小。而m = 磁盘块的大小 / 数据项的大小。磁盘块的大小也就是一个数据页的大小,是固定的。假设数据项占的空间越小,数据项的数量越多,树的高度越低。

这就是为什么每一个数据项,即索引字段要尽量的小,比方int占4字节,要比bigint8字节少一半。这也是为什么b+树要求把真实的数据放到叶子节点而不是内层节点,一旦放到内层节点,磁盘块的数据项会大幅度下降。导致树增高。当数据项等于1时将会退化成线性表。

2.当b+树的数据项是复合的数据结构,比方(name,age,sex)的时候,b+数是依照从左到右的顺序来建立搜索树的。比方当(张三,20,F)这种数据来检索的时候。b+树会优先比較name来确定下一步的所搜方向。假设name同样再依次比較age和sex。最后得到检索的数据。但当(20,F)这种没有name的数据来的时候,b+树就不知道下一步该查哪个节点,由于建立搜索树的时候name就是第一个比較因子,必须要先依据name来搜索才干知道下一步去哪里查询。

比方当(张三,F)这种数据来检索时。b+树能够用name来指定搜索方向,但下一个字段age的缺失,所以仅仅能把名字等于张三的数据都找到,然后再匹配性别是F的数据了。 这个是很重要的性质,即索引的最左匹配特性。

建索引的几大原则

1.最左前缀匹配原则,很重要的原则。mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比方a = 1 and b = 2 and c > 3 and d = 4 假设建立(a,b,c,d)顺序的索引,d是用不到索引的。假设建立(a,b,d,c)的索引则都能够用到,a,b,d的顺序能够随意调整。

2.=和in能够乱序,比方a = 1 and b = 2 and c = 3 建立(a,b,c)索引能够随意顺序。mysql的查询优化器会帮你优化成索引能够识别的形式

3.尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不反复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问。这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般须要join的字段我们都要求是0.1以上,即平均1条扫描10条记录

4.索引列不能參与计算,保持列“干净”。比方from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很easy,b+树中存的都是数据表中的字段值,但进行检索时,须要把全部元素都应用函数才干比較,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);

5.尽量的扩展索引,不要新建索引。比方表中已经有a的索引,如今要加(a,b)的索引。那么仅仅须要改动原来的索引就可以

mysql优化之索引建立的规则的更多相关文章

  1. mysql 优化之索引的使用

    mysql 优化之索引的使用 1:MySQL 索引简介: MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度. 打个比方,如果合理的设计且使用索引的MySQL ...

  2. 【Mysql优化】索引优化策略

    1:索引类型 1.1 B-tree索引 注: 名叫btree索引,大的方面看,都用的平衡树,但具体的实现上, 各引擎稍有不同, 比如,严格的说,NDB引擎,使用的是T-tree   Myisam,in ...

  3. mysql优化之索引篇

    对mysql优化是一个综合性的技术,主要包括 a: 表的设计合理化(符合3NF) b: 添加适当索引(index) [四种: 普通索引.主键索引.唯一索引unique.全文索引] c: 分表技术(水平 ...

  4. mysql优化之索引优化

    Posted by Money Talks on 2012/02/23 | 第一篇 序章第二篇 连接优化第三篇 索引优化第四篇 查询优化第五篇 到实战中去 索引优化 索引优化涉及到几个方面,包括了索引 ...

  5. Mysql优化之索引和字段

    Mysql优化是一个老生常谈的问题, 优化的方向也优化很多:从架构层;从设计层;从存储层;从SQL语句层; 今天讲解一下从索引和字段: 字段优化: ①  尽量使用TINYINT.SMALLINT.ME ...

  6. MySQL优化之索引解析

    索引的本质 MySQL索引或者说其他关系型数据库的索引的本质就只有一句话,以空间换时间. 索引的作用 索引关系型数据库为了加速对表中行数据检索的(磁盘存储的)数据结构 索引的分类 数据结构上面的分类 ...

  7. 第九课——MySQL优化之索引和执行计划

    一.创建索引需要关注什么? 1.关注基数列唯一键的数量: 比如性别,该列只有男女之分,所以性别列基数是2: 2.关注选择性列唯一键与行数的比值,这个比值范围在0~1之前,值越小越好: 其实,选择性列唯 ...

  8. MySQL优化之索引原理(二)

    一,前言 ​ 上一篇内容说到了MySQL存储引擎的相关内容,及数据类型的选择优化.下面再来说说索引的内容,包括对B-Tree和B+Tree两者的区别. 1.1,什么是索引 ​ 索引是存储引擎用于快速找 ...

  9. MySQL优化四 索引优化

    索引为什么能提高数据访问性能? 很多人只知道索引能够提高数据库的性能,但并不是特别了解其原理,其实我们可以用一个生活中的示例来理解. 我们让一位不太懂计算机的朋友去图书馆确认一本叫做<MySQL ...

随机推荐

  1. 【Luogu】P3971Alice And Bob(贪心)

    题目链接 容易发现值为x的点只可能从值为x-1的点转移过来,所以我们把原序列连成一棵树,dfs序就是原序列的一种形式. 就可以直接求啦 #include<cstdio> #include& ...

  2. 使用 SOAPUI 测试Web Service

    原文地址:https://www.ibm.com/developerworks/cn/webservices/1106_webservicessecurity/index.html(里面内容比较多不用 ...

  3. Github与Eclipse连接(方法2成功:Pleiades)

    2018-3-7 第1次尝试 主要参考这位大神的笔记:http://blog.csdn.net/zhangdaiscott/article/details/16939165 方法非常简单,从官网htt ...

  4. leetcode 26 水

    class Solution { public: int removeDuplicates(vector<int>& nums) { sort(nums.begin(),nums. ...

  5. Oracle学习记录1

    1.current_date与sysdate区别 在oracle中current_date与sysdate都是显示当前系统时间, 其结果基本相同,但是有三点区别:a. current_date返回的是 ...

  6. SharePoint 2013 SSO-Secure Store Service在实际案例中的应用

    文章目录: Secure Store Service介绍 Secure Store Service部署 Secure Store Service应用 之前有一篇博客讲到使用EMSManagedAPI操 ...

  7. 【CF500D】New Year Santa Network(树上统计)

    ..]of longint; z:..]of extended; n,i,m,tot,x1:longint; ans,fenmu,y1:extended; procedure add(a,b:long ...

  8. [LeetCode] Rotate Image n-by-n矩阵顺时针旋转

    You are given an n x n 2D matrix representing an image. Rotate the image by 90 degrees (clockwise). ...

  9. Springboot 集成 Thymeleaf 及常见错误

    Thymeleaf模板引擎是springboot中默认配置,与freemarker相似,可以完全取代jsp,在springboot中,它的默认路径是src/main/resources/templat ...

  10. Java heap space设置方法记录

    最近被 OutOfMemory Error折腾得够呛,记载一点设置JVM虚拟机内存Javaheap space的方法. Tomcat 7 参考:  http://www.davidghedini.co ...