索引是什么

假如你手上有一个你公司的客户表,老板说找什么客户你就得帮他找出来。

客户不多的时候,你拿着手指一行一行滑,费不了多少时间就能找到。

后来公司做大了,客户越来越多,好几页的客户,你发现,一行一行滑真的好累啊,最主要找慢了还得挨老板叼。

他妈的,吃力不讨好。

那咋办?

我相信这么聪明的你不会坐以待毙的。

你可能会自己做一些记录,比如拿个小本本写上,

28岁的客户在第一页

29岁的客户在第二页

或者

姓张的客户在第二页

姓李的客户在第三页和第四页

当然这些要根据那张客户表的实际情况来。

这样子,下次老板叫你找29岁的客户,你就一下子翻到第二页,一下子就找到了,轻松又漂亮地解决了问题。

这么机智地解决了问题,当上ceo,迎娶白富美就指日可待了。

好了,美好故事到此就结束了。

真实的情况是怎么样的呢?

真实的情况就是数据库就是故事中的你,你就是故事中的老板,故事中的小本本,就是咱们今天要讲的索引。

索引的特点

那么从这个故事中可以看出索引有什么特点呢?

为了提高查找效率而建立

如果你不给数据库加索引的话,多数情况下,它就真的是一行行找,效率极低。

数据量少的时候不需要索引

但数据量少的时候,也没必要建索引,你想想啊,数据量少的时候,你一下子就找到了,速度比你去翻小本本时间可能还要快点,就不要浪费一个小本本了。

MySQL的索引本质也是一张表的,建立索引也需要相应的空间。

索引是建立在表的数据上的

上面的故事里我也说了,小本本的内容要根据你表里的实际情况来的。

这样的话,如果建立了索引,就要注意两个点:

  1. 不要实际删除数据。

    假如你有批客户闹掰了,你一生气,把客户表中那一整页都撕了。

    那你下次按照【31岁的客户在第20页】这个规则去找,但是前面的就被你撕了,现在31岁的客户就提前了几页,你数到第20页,发现找不到,人都傻了。

    MySQL也是这样的,如果删除数据,会导致按照索引查找的数据不会在原先的位置上。

  2. 频繁更新的字段不要建立索引。

    假设用户的年龄天天变,那最好也不要记在小本本上了,否则你每天都要去更新小本本,今天是【31岁的客户在第20页】,明天就要改成【32岁的客户在第20页】了。

    MySQL也是这样的,如果建立索引的字段频繁更新,这样便会导致之前建立的索引需要频繁更新。

MySQL索引分类

人家MySQL建立索引的方式比我们记小本本的方式要聪明有效率地多了。

你可以看到我上面做小本本的方式都是根据表中的某一列来的,比如

【31岁的客户在第20页】这个是根据客户的年龄这一列来做的;

【姓李的客户在第三页和第四页】这个使用客户的名字这一列来做的。

在MySQL中,我们也只是需要告诉MySQL用哪些列来做索引即可,然后接下来的事他就会自己做。

咱们建立的索引呢,根据使用列的情况不同,可以分类如下:

  • 单值索引:即一个索引只包含单个列。一个表可以有多个单列索引。

  • 唯一索引:索引列的值必须唯一,但允许有空值。

  • 复合索引:即一个索引包含多个列。

假如现在有一个people表,内有字段id(主键不需要做索引),name,age,phone_number(电话号码)那么:

  • 单值索引:可以单独用nameage做一个索引,任何一个字段都可以。这样的索引可以做多个。
  • 唯一索引:和单值索引一样,但做索引的该字段必须唯一,比如你确定people表中phone_number的值唯一的话,那么便可以在上面建立唯一索引。
  • 复合索引:可以用(name,age)(age,phone_number)(name,age,phone_number)做一个索引。

建议:建立复合索引,且一个表不要超过5个索引。

基本语法

  • 创建(如果加上UNIQUE则创建唯一索引):

    CREATE [UNIQUE] INDEX indexName ON mytable(columnname(length));



    ALTER mytable ADD [UNIQUE] INDEX[indexName] ON (columnname(length));

  • 删除:

    DROP INDEX [indexName] ON mytable;

  • 查看:

    SHOW INDEX FROM table\G

MySQL索引结构

就是上面的索引建立好后,这事虽然不用我们管,但也可以了解一下,MySQL是按照什么样的策略去查找数据的呢。

有几种结构,下面讲的是比较常用的BTree结构。

  • 图片介绍:

    如图一颗B+树,浅蓝色表示磁盘块,每个磁盘块包括几个数据项(深蓝色)和指针(黄色)。

    如磁盘块1包括数据项17和35,包含指针P1、P2、P3;P1表示小于17的磁盘块,P2表示在17-35之间的磁盘块,P3表示大于35的磁盘块。

    真实的数据只存在于叶子节点,非叶子节点不存储真实数据,只存储指引搜索方向的数据项。

    如17、35并不真实存在数据表中。

  • 查找过程(以上图查找数据项29):

    首先把磁盘块1由磁盘加载到内存,此时发生一次IO;在内存中用二分查找确定29在17和35之间,锁定磁盘块1的P2指针,因为内存时间非常短(相比磁盘的IO)可以忽略不计。

    将磁盘块1的P2指向的磁盘块3由磁盘加载到内存,发生第二次IO;确定29在26和30之间,指向磁盘块3的P2指针。

    将磁盘块3的P2指针指向的磁盘块8加载到内存,发生第三次IO,同时内存中做二分查找找到29。

    查询结束,总计三次IO。

  • 真实的情况是:3层的B+树可以表示上百万的数据,如果上百万的数据查找只需要3次IO,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次IO,那么总共需要上百万次IO。

  • 总结:减少IO次数可以减少查询时间,提高性能,那么怎么减少IO次数?

    答案:增加树的广度而非深度。B+树的叶子节点可以多。

建立索引的时机

哪些情况需要创建索引
  • 主键自动建立唯一索引
  • 频繁作为查询条件的字段应该创建索引
  • 查询中与其他表关联的字段,外键关系建立索引
  • 频繁更新的字段不适合创建索引 -- 因为每次更新不只更新记录还会更新索引
  • Where里用不到的字段的不创建索引
  • 单键/组合索引的选择问题 -- 在高并发下倾向创建组合索引
  • 查询中排序的字段 -- 排序字段若通过索引去访问将大大提高排序速度
  • 查询中统计或者分组字段
哪些情况不需要创建索引
  • 表记录太少 -- mysql300w左右就可以考虑建索引了
  • 经常增删改的表 -- 因为索引要跟着更新
  • 数据重复且分布平均的表字段 -- 可以用(该字段不同的数据的数量)/(该字段总的数据量),值越接近1,说明不怎么重复,越有建索引的价值。

浅谈sql索引的更多相关文章

  1. 浅谈SQL优化入门:3、利用索引

    0.写在前面的话 关于索引的内容本来是想写的,大概收集了下资料,发现并没有想象中的简单,又不想总结了,纠结了一下,决定就大概写点浅显的,好吧,就是懒,先挖个浅坑,以后再挖深一点.最基本的使用很简单,直 ...

  2. c#Winform程序调用app.config文件配置数据库连接字符串 SQL Server文章目录 浅谈SQL Server中统计对于查询的影响 有关索引的DMV SQL Server中的执行引擎入门 【译】表变量和临时表的比较 对于表列数据类型选择的一点思考 SQL Server复制入门(一)----复制简介 操作系统中的进程与线程

    c#Winform程序调用app.config文件配置数据库连接字符串 你新建winform项目的时候,会有一个app.config的配置文件,写在里面的<connectionStrings n ...

  3. 转【】浅谈sql中的in与not in,exists与not exists的区别_

    浅谈sql中的in与not in,exists与not exists的区别   1.in和exists in是把外表和内表作hash连接,而exists是对外表作loop循环,每次loop循环再对内表 ...

  4. 浅谈sql中的in与not in,exists与not exists的区别

    转 浅谈sql中的in与not in,exists与not exists的区别   12月12日北京OSC源创会 —— 开源技术的年终盛典 »   sql exists in 1.in和exists ...

  5. 浅谈SQL Server数据内部表现形式

    在上篇文章 浅谈SQL Server内部运行机制 中,与大家分享了SQL Server内部运行机制,通过上次的分享,相信大家已经能解决如下几个问题: 1.SQL Server 体系结构由哪几部分组成? ...

  6. 浅谈SQL Server---2

    浅谈SQL Server内部运行机制 https://www.cnblogs.com/wangjiming/p/10098061.html 对于已经很熟悉T-SQL的读者,或者对于较专业的DBA来说, ...

  7. 浅谈SQL Server---1

    浅谈SQL Server优化要点 https://www.cnblogs.com/wangjiming/p/10123887.html 1.SQL Server 体系结构由哪几部分组成? 2.SQL ...

  8. 浅谈SQL注入风险 - 一个Login拿下Server

    前两天,带着学生们学习了简单的ASP.NET MVC,通过ADO.NET方式连接数据库,实现增删改查. 可能有一部分学生提前预习过,在我写登录SQL的时候,他们鄙视我说:“老师你这SQL有注入,随便都 ...

  9. 浅谈sql 、linq、lambda 查询语句的区别

    浅谈sql .linq.lambda 查询语句的区别 LINQ的书写格式如下: from 临时变量 in 集合对象或数据库对象 where 条件表达式 [order by条件] select 临时变量 ...

随机推荐

  1. NOI 2020 D1T3 本人题解

    我看了出题人本题的做法,感觉很难写,就自己胡了一个\(O((n + m) \sqrt n)\)的做法. 第一步我的想法与出题人一样,都是考虑容斥降维.对第\(i\)组询问,我们枚举两个事件中较大的一个 ...

  2. 谷歌SameSite策略

    当我新下载谷歌80.x版本的时候,访问一个系统(内嵌跳转到其他系统的iframe),跳转过去没有携带cookie,以前版本的谷歌浏览器是可以的,控制台提示SameSite策略,给阻止了cookie携带 ...

  3. STM32系统时钟RCC(基于HAL库)

    基础认识 为什么要有时钟: 时钟就是单片机的心脏,其每跳动一次,整个单片机的电路就会同步动作一次.时钟的速率决定了两次动作的间隔时间.速率越快,单片机在单位时间内所执行的动作将越多.时钟是单片机运行的 ...

  4. 如何使用交易开拓者(TB)开发数字货币策略

    更多精彩内容,欢迎关注公众号:数量技术宅.想要获取本期分享的完整策略代码,请加技术宅微信:sljsz01 为何使用交易开拓者(TB)作为回测工具 交易开拓者(后文以TB简称)是一个支持国内期货市场K线 ...

  5. linux下postgresql安装

    1.下载地址 https://www.enterprisedb.com/download-postgresql-binaries 2.创建用户并修改密码 [root@node01 ~]# userad ...

  6. 【Electron Playground】Electron 窗口问题汇总

    作者:Kurosaki 本节旨在汇总在开发Electron 窗口可能遇到的问题,做一个汇总,后续遇到问题会持续更新. 1. 窗口闪烁问题. const { BrowserWindow } = requ ...

  7. 2020.12.16 模拟赛x+1

    A. 接力比赛 跑两遍背包,再进行一些玄学的剪枝 代码 #include<cstdio> #include<algorithm> #define rg register inl ...

  8. DSL查询基础—关键字

    1.query查询语句 { "query" : { "match" : { "last_name" : "Smith" ...

  9. netsniff恶意流量识别和匹配解读

    代码整体框架 流量扫描函数调用 加载配置文件的代码调用 获取扫描的条数 重点匹配函数 流量eg:'\x00\x04\x00\x01\x00\x06\x00\x16>\x10\x1d>SW\ ...

  10. python菜鸟教程学习:数据结构

    列表方法 list.append(x):把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]. list.extend(L):通过添加指定列表的所有元素来扩充列表,相当于 a[len( ...