MySQL 第八天(核心优化二)
一.昨天内容回顾
- 存储引擎保存数据的格式(技术),不同格式体现特性不一样 myisam ① 结构、数据、索引 文件单独存储 ② 存入数据顺序(不考虑主键顺序) ,写入数据速度快 ③ 并发性,低,锁整张表 ④ 压缩机制 innodb ① 结构有单独文件,数据和索引合并到一个文件中 (通过设置,可以给每个表设置一个"数据/索引"文件) ② 存入数据顺序(给考虑主键值的先后顺序,数值大小排序存储) ③ 并发性,高,锁行 
- 字段选择① 字段选取占据空间小的(bigint int mediumint smallint tinyint) ② 内容长度固定,选取char类型使用 varchar() ③ 数据最好存储为整型的(时间、set/enum、ip地址) 
- 逆范式
- 索引索引是数据结构,其内部有算法(规律、规则) - 四种类型、创建、删除
 四种:主键、唯一[例如用户名唯一]、普通、全文索引 ,复合索引 - 执行计划
 针对查询select语句起作用 sql语句在没有执行之前把所有需要的资源都准备好,我们可以预先 查看下 我们关心sql语句是否用到索引 explain sql语句\G; - 适合场合
 ① where ② 排序字段 select * from 表名 order by 字段 limit 1000000,50; 不会用索引 select * from 表名 order by 字段 limit 50; 用索引 select * from 表名 order by 字段 limit 100,50; 用索引 select * from 表名 order by 字段 limit 偏移量,50; 用索引 偏移量如果超过10万,就不会使用索引。 ③ 索引覆盖 ④ 连表查询,外键设置索引 - 使用原则
 ① 字段独立 ② 左原则(模糊查询) ③ 复合索引 ④ or原则 
- 索引- 1. 设计依据- ① 被频繁使用的字段设置索引 - 字段被频繁用在where和order等条件里边。 - 数据表创建完毕,要预估那些字段被经常使用,就给其创建索引 - ② 执行时间长的sql语句考虑设计索引 - 可以利用"慢查询日志"收集这样的sql语句并优化设计索引 - ③ 逻辑非常重要的sql语句考虑设计索引 - 例如商城系统里边,会员给自己账户充值就比较重要 - 还有会员下订单购物,进行付款的时候也比较重要。 - ④ 字段内容足够花样化,可以考虑设计索引 - 反面教材,性别不能设计索引(内容的取值非常少) - 2. 前缀索引- 什么是前缀索引: - 如果一个字段的内容的前边的n位信息已经足够可以标识当前的字段内容,就可以把字段的前n位获得出来并创建索引, - 通过字段内容前n位创建的索引就称为"前缀索引"。 - 例如: - 关伟 - 吕纪无 - 刘尚 - 王云斐 - 以上字段内容,通过前1位,就可以唯一标识当前字段内容,这样就把前1位取出来创建索引 - 好处:索引占据的物理空间要比较小,这样的索引运行速度快、效率高,对mysql整体性能提升有很大帮助。 - 具体操作: - alter table 表名 add key (字段(位数)) - 思考: - 到底是前几位可以标识当前字段内容 - 通过substring获得字段的前n为信息,从1开始递增时获取 - 获取的时候去除重复的,计算总个数,不断增加n的数值,直至总个数稳定 - 此时n的数值就是适合做"前缀索引"的数字。 - 索引是给sql语句做优化 - 前缀索引,是给索引做的优化 - 获得字段的前n位:substring(字段,开始位置,长度n) mysql函数  - 同上上图可以知道,通过前11位,可以给epassword字段设置索引。   - 3. in条件索引使用 - 4. 全文索引- 什么是全文索引: - 其他索引是把字段的内容作为一个整体进行索引设计 - 全文索引,类似我们有一篇作文,把作文中的一些关键字给获取出来当成是索引内容。 - 具体理解,就是做like模糊查询,类似baidu搜索一些关键字效果。   - 全文索引注意: - ① 字段类型必须为varchar/char/text类型 - ② mysql 5.6.4之前只有Myisam支持,5.6.4之后则Myisam和innodb都支持。 - ③ mysql中的全文索引目前只支持英文(不支持中文),如果需要支持中文可以使用sphinx - ④ 现实生产中mysql的全文索引不经常使用,sphinx常使用 - mysql全文索引自作聪明,对关键字的收录有自己的考虑。  - 版本是5.5.27,因此只有Myisam支持全文索引。 - 4.1 具体操作- CREATE TABLE articles ( - id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, - title VARCHAR(200), - body TEXT - )engine=myisam charset utf8; - INSERT INTO articles (title,body) VALUES - ('MySQL Tutorial','DBMS stands for DataBase ...'), - ('How To Use MySQL Well','After you went through a ...'), - ('Optimizing MySQL','In this tutorial we will show ...'), - ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'), - ('MySQL vs. YourSQL','In the following database comparison ...'), - ('MySQL Security','When configured properly, MySQL ...'); - alter table articles add fulltext index `index_body` (body); - 现在已经有了一个index_body的全文索引: - 因此类似如下sql语句就可以使用到索引了 - select * from articles where body like '%内容%'; - 但是sql语句需要变形为: - select * from articles where match(字段body) against(内容);   - 4.2 复合全文索引- alter table articles add fulltext index `index_fu` (title,body); - select * from articles where title like '%内容%' and body like '%内容%'  - 5. 索引结构(了解)- 索引的数据结构 - 主要讨论两种:Myisam 和 Innodb - Mysql的数据结构都是B+tree结构 - 数据结构:数据以一种规律的、规则的方式组织在一个格式里边,可以保证我们获得数据的快速性。 - 5.1 Myisam索引结构- 该Myisam索引结构称为"非聚合型"  - 上图说明,主键内容在该索引里边通过算法开始被查询、获得,并借助"指针"向下级寻找,直到找到对应的叶子节点。 - 叶子节点里边有该关键字对应的记录的物理地址,进而获得对应的记录信息。 - 索引运行原理:快速定位主键id值,获得对应记录物理地址,获得记录信息。 - 每个主键id值都是一个节点,节点本身有指针。 - 最底层的节点称为"叶子节点",该节点与记录的物理地址直接联系 - 上图节点从上到下的层次数是索引结构的高度 - 每层节点的数目称为结构的宽度 - 结构的宽度、高度的数目由mysql底层算法计算获得(过高、过宽都不利于数据的快速获取)  - Myisam其他索引结构与主键索引结构一致。 - 通过上图索引结构,我们看到了 索引部分 和 数据部分是分离的,它们之间通过物理地址进行联系。  - 5.2 Innodb索引结构- 该Innodb索引结构称为"聚合型" - 聚合在:"索引"和"数据"是合并在一个文件里边的。  - 下图表示innodb的其他索引(唯一、普通) - 该(用户名字)其他索引运行原理: - ① 通过索引结构内部的算法快速定位该名字对应的"叶子节点" - ② 叶子节点 里边对应的是关键字的记录主键id值 - ③ 通过记录主键id值走主键索引即可   - innodb(主键)索引运行原理: - ① 通过索引结构快速定位主键id值对应的"叶子节点" - ② 该叶子节点 里边直接与整条记录信息进行对应(而在Myisam里边,叶子节点与物理地址对应) - innodb索引: - 普通索引关键字----->记录的主键id值------>记录的整条信息 - 三.缓存设置- 有的被频繁执行的sql语句,比较消耗时间、消耗系统资源(没的优化可做) - 并且每次获得数据还不太发生变化 - 那么就把这个sql语句获得信息给缓存起来,供后续执行使用 - 这样非常节省系统资源。 - 1. 具体使用    
- 缓存失效- 数据表的数据有变化 或者 数据表结构有变化,则缓存失效。  - 3. 什么情况不使用缓存- sql语句每次获得数据有变化。 - 例如有 时间信息、随机数等   - 4. 生成多个缓存- 生成缓存的sql语句对"空格"、"大小写"比较敏感 - 相同结果的sql语句,由于空格、大小写问题就会分别生成缓存。  - 5. 不使用缓存- sql_no_cache 不进行缓存  - 6. 查看缓存空间使用情况  - 总结: 
- 索引依据:频繁、时间长、逻辑重要
- 前缀索引
- 全文索引(搜索引擎 baidu google 数据检索)
- 索引结构:Myisam innodb(主键、其他索引)
- 缓存设置四.分表设计一个数据表里边存储的记录信息太多了,记录的条数达到1-2亿条信息。 这时该数据表的活性就大大降低,数据表的运行速度就比较慢、效率低下,影响mysql数据库的整体性能。 现在设置一个水平分割,把许多的记录信息分别存储到不同的数据表里边,这样每个表存储的记录就比较少,该表的活性大大提高。 分表设计的两种模式: ① 逻辑方式分表 mysql数据库本身就有分表技术,该方式的分表可以节省php的逻辑处理。  ② 物理方式分表 自己手动创建多个数据表出来 php程序需要考虑分表算法:数据往哪个表写,从哪个表读  1. 演示逻辑分表设计mysql本身就支持的分表技术   以上逻辑分表设计,在php程序里边无需设置额外算法代码,还像以往一样直接对goods数据表进行操作即可,mysql本身会考虑分表的算法。 2. 四种格式的逻辑分表具体为:key hash ---->[求余方式] range list ---->[范围方式] 注意:分表字段必须是主键 或 主键的一部分 2.1 key分表partition by key(条件字段id) partitions 10; 2.2 hash分表根据表达式/字段方式进行分表设计 partition by hash(表达式/字段) partitions 数量;    2.3 range分表根据 字段/表达式 是否满足某个范围条件进行分表设计 partition by range(year(pubdate))( partition hou70 values less than (1980), partition hou80 values less than (1990), partition hou90 values less than (2000), partition hou00 values less than (2010) )   2.4 list分表根据 表达式/字段 的内容值是否在某个"列表"中进行分表设计。 partition by list(month(pubdate))( partition spring values in (3,4,5), partition summer values in (6,7,8), partition autumn values in (9,10,11), partition winter values in (12,1,2) )   3. 分表管理具体就是对已经存在的分表进行增加、减少操作。 增加分表 不会引起数据丢失。 减少分表 在range/list领域会造成数据丢失 在key/hash领域不会造成数据丢失, 这两个领域在进行减少分表的同时就把全部数据重新整合到存在的表中, key/hash两种分表与业务逻辑关联不紧密。 增加分表求余方式: key/hash > alter table 表名 add partitions 数量; 范围方式: range/list > alter table 表名 add partition( partition 名称 values less than (常量) 或 partition 名称 in (n,n,n) );  3.2 删除分表求余方式(key/hash): >alter table 表名 coalesce partition 12; 删除分表不会造成数据丢失,每次分表数据都重新整合到存在的分表里边。 范围方式(range/list): >alter table 表名 drop partition 分区名称; 删除分表会造成数据丢失 ① key/hash方式不会丢失数据      ② range/list会丢失数据给range分表写4条记录:   把"hou80"的分区删除,从下图查询结果看对应分表的数据也丢失了。    4. 物理分表设计 以上goods的物理分表需要增加php的算法逻辑: 需要计算记录从哪个表读、给哪个表写。 4.1 php对物理分表的操作 5. 垂直分表水平分表:是把一个表的全部记录信息分别存储到不同的分表之中。 垂直分表:是把一个表的全部字段分别存储到不同的表里边。 有的时候,一个数据表设计好了,里边有许多字段,但是这些字段有的是经常使用的,有的是不常用的。 例如,一个数据表有20个字段,其中10个字段是常用的,后10个字段是不常用的 那么在操作常用字段的时候,就不得不给其他不常用的字段也分配一定的资源进行操作。 数据表: 会员表: user_id 登录名 密码 邮箱 手机号码 
 身高 体重 性别 家庭地址 身份证号码以上表,红色是常用的,蓝色的是不常用的 为了使得常用字段运行速度更快、效率更高,把常用字段给挑选出来,因此数据表做以下设计: 会员表(主)字段:user_id 登录名 密码 邮箱 手机号码 会员表(辅)字段:user_id 
 身高 体重 性别 家庭地址 身份证号码以上把会员表根据字段是否常用给分为两个表的过程就是垂直分表。 
- 架构设计- 架构设计也称为集群设计:由多台mysql服务器共同支撑网站的运行,每台服务器分担的工作就比较少,运行速度快、效率高。 - mysql数据库在运行的时候一般查询/写入的sql语句比例为:7/1 - 并且查询消耗的资源比写入要更多。 - 因此可以设计一个"主从模式"的集群,与之前redis的主从模式使用模式一致。 - 维护备份的集群架构:  - 主从模式的集群架构:  - 六.慢查询日志收集- 我们要把系统里边一些执行速度非常慢的sql语句给收集起来,并做分析优化,使得其执行速度加快。      - 总结: 
- 水平分表设计分的是数据记录 - 逻辑分表
 求余:key/hash 范围:range/list 创建/增加分表:新建表时、分表创建完毕还可以增加 删除分表:key/hash不会造成数据丢失 range/list能造成数据丢失 - 物理分表
 php代码需要增加算法逻辑 
- 垂直分表分的是表的字段 
- 架构设计架构集群有两种方式: ① 互为备份 ② 主从模式[常用] 
- 慢查询日志收集
MySQL 第八天(核心优化二)的更多相关文章
- MySql学习(六) —— 数据库优化理论(二) —— 查询优化技术
		逻辑查询优化包括的技术 1)子查询优化 2)视图重写 3)等价谓词重写 4)条件简化 5)外连接消除 6)嵌套连接消除 7)连接消除 8)语义优化 9)非SPJ优化 一.子查询优化 1. ... 
- MySQL 第七天(核心优化一)
		一.Mysql核心优化 1. 优化的方面 ① 存储层:数据表"存储引擎"选取.字段选取.逆范式(3范式) ② 设计层:索引.分区/分表 ③ 架构层:分布式部署(主从模式/共享) ④ ... 
- 十三、linux-mysql的mysql的核心优化思想
		一.数据库运维管理思想核心 1.未雨绸缪,不要停留在制度上,而是要实际做出来 2.亡羊补牢,举一反三,不要好了伤疤忘了疼 3.完善的框架设计及备份.恢复策略 4.定期思考,并实战模拟以上策略演练 二. ... 
- MySQL优化二(连接优化和缓存优化)
		body { font-family: Helvetica, arial, sans-serif; font-size: 14px; line-height: 1.6; padding-top: 10 ... 
- mysql优化二之锁机制
		mysql优化二之锁机制 mysql提供了锁机制和MVCC机制来保证并发操作的安全性,这里主要讨论锁机制, MVCC见下篇文章 mysql的锁按照锁粒度可分为行锁与表锁,按照操作类型划分可读锁和写锁 ... 
- MySQL性能优化(二):优化数据库的设计
		原文:MySQL性能优化(二):优化数据库的设计 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.n ... 
- MySQL之查询性能优化(二)
		查询执行的基础 当希望MySQL能够以更高的性能运行查询时,最好的办法就是弄清楚MySQL是如何优化和执行查询的.MySQL执行一个查询的过程,根据图1-1,我们可以看到当向MySQL发送一个请求时, ... 
- 第 8 章 MySQL 数据库 Query 的优化
		前言: 在之前“影响 MySQL 应用系统性能的相关因素”一章中我们就已经分析过了Query语句对数据库性能的影响非常大,所以本章将专门针对 MySQL 的 Query 语句的优化进行相应的分析. ... 
- MySQL 数据库 Query 的优化
		理解MySQL的Query Optimizer MySQL Optimizer是一个专门负责优化SELECT 语句的优化器模块,它主要的功能就是通过计算分析系统中收集的各种统计信息,为客户端请求的Qu ... 
- spark核心优化详解
		大家好!转眼又到了经验分享的时间了.吼吼,我这里没有摘要也没有引言,只有单纯的经验分享,请见谅哦! 言归正传,目前在大数据领域能够提供的核心计算的工具,如离线计算hadoop生态圈的mr计算模型,以及 ... 
随机推荐
- Python之路,day12-Python基础
			Mysql数据库操作 数据库介绍 什么是数据库? 数据库(Database)是按照数据结构来组织.存储和管理数据的仓库,每个数据库都有一个或多个不同的API用于创建,访问,管理,搜索和复制所保存的数据 ... 
- linux yum命令详解-转
			yum(全称为 Yellow dog Updater, Modified)是一个在Fedora和RedHat以及SUSE中的Shell前端软件包管理器.基於RPM包管理,能够从指定的服务器自动下载RP ... 
- KNN近邻算法
			K近邻(KNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表.kNN算法的核 ... 
- java关键字:synchronized
			JAVA 如何共享资源 关于synchronized函数: java具有内置机制,可防止某种资源(此处指的是对象的内存内容)冲突.由于你通常会将某class的数据元素声明为private,并且只经由其 ... 
- 【python】python定时器
			#coding:utf-8 import os import time def print_ts(message): print "[%s] %s"%(time.strftime( ... 
- Android广播机制的深入学习
			部分内容转载自http://www.cnblogs.com/lwbqqyumidi/p/4168017.html 1.Android广播机制概述 Android广播分为两个方面:广播发送者和广播接收者 ... 
- NHibernate Demo 和 效率测试
			本文关于NHibernate的Demo和效率测试,希望对大家有用. 1.先去官网下载Nhibernate 2.放入到项目中并建立Helper类 private static ISession _Ses ... 
- 如何在Visual Studio里面查看程序的汇编代码?
			开发工具:Visual Studio 2015 1,在源代码中设置至少一个断点,目的让我们进入调试模式. 2,启动调试,当程序进入调试模式,停留在我们设定的断点处时候,使用快捷键"ALT+8 ... 
- Python IDE PyCharm的基本快捷键和配置简介
			快捷键 1.编辑(Editing)Ctrl + Space 基本的代码完成(类.方法.属性)Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctr ... 
- (转)Java:按值传递和按引用传递详细解说
			值传递和引用传递详解: 1:按值传递是什么 指的是在方法调用时,传递的参数是按值的拷贝传递.示例如下: public class TempTest { private void test1(int a ... 
