MYSQL学习笔记——数据库范式及MYSQL优化整体思路

一、数据库范式

为了建立冗余较小、结构合理的数据库，设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库，必须满足一定的范式。

1.1、第一范式（1NF：每一列不可包含多个值）
所谓第一范式（1NF）是指数据库表的每一列都是不可分割的基本数据项，同一列中不能有多个值，即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性，就可能需要定义一个新的实体，新的实体由重复的属性构成，新实体与原实体之间为一对多关系。在第一范式（1NF）中表的每一行只包含一个实例的信息。
在任何一个关系数据库中，第一范式（1NF）是对关系模式的基本要求，不满足第一范式（1NF）的数据库就不是关系数据库。

1.2、第二范式（2NF：非主属性部分依赖于主关键字）
第二范式（2NF）是在第一范式（1NF）的基础上建立起来的，即满足第二范式（2NF）必须先满足第一范式（1NF）。第二范式（2NF）要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。
第二范式（2NF）要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性，如果存在，那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。简而言之，第二范式就是非主属性部分依赖于主关键字。

1.3、第三范式（3NF：属性不依赖于其它非主属性）
满足第三范式（3NF）必须先满足第二范式（2NF）。简而言之，第三范式（3NF）要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如，存在一个部门信息表，其中每个部门有部门编号、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表，则根据第三范式（3NF）也应该构建它，否则就会有大量的数据冗余。简而言之，第三范式就是属性不依赖于其它非主属性。

1.4、反三范式（反3NF：为了性能，增加冗余）

3NF提出目的是为了降低冗余，减少不必要的存储，这对于存储设备昂贵的过去是很有必要的，但是随着存储设备的降价以及人们对性能的不断提高，又有人提出反三范式。

所谓反三范式就是为了性能，增加冗余。以部门信息表为例，每个部门有部门编号、部门名称、部门简介等信息，按照3NF的要求，为了避免冗余，我们在员工表中就不应该加入部门名称、部门简介等部门有关信息，带来的代价是每次都要查询两次数据库。反三范式允许我们冗余重要信息到员工表中，例如部门名称，这样我们每次取员工信息时就能直接取出部门名称，不需要查询两次数据库，提升了程序性能。

二、MYSQL优化整体思路

MYSQL优化首先应该定位问题，可能导致MYSQL低性能的原因有：业务逻辑过多的查询、表结构不合理、sql语句优化以及硬件优化，从优化效果来看，这四个优化点的优化效果依次降低：理清业务逻辑能够帮助我们避免不必要的查询，合理设计表结构也能帮助我们少查询数据库。对于sql语句优化，我们可以先使用慢查询日志（慢查询日志的使用：http://www.cnblogs.com/timlearn/p/4052523.html）定位慢查询，然后针对该查询进行优化，最常见且最有效的优化范式就是增加合理的索引，这个在上篇博客http://www.cnblogs.com/timlearn/p/4055512.html已经讲解，本篇博客将讲解其他一些优化手段或者注意点。

2.1、谨慎使用TEXT/BLOB类型

当列类型是TEXT或者BLOB时，我们应该特别注意，因为当选择的字段有 text/blob 类型的时候，无法创建内存表，只能创建硬盘临时表，而硬盘临时表的性能比内存表的性能差，所以如果非要使用TEXT/BLOB类型，应该单独建表，不要把TEXT/BLOB类型与核心属性混合在一张表中。对此，做一个实验如下：

//创建数据表

create table t1 (

num int,

intro text(1000)

);

//插入数据

insert into t1 values (3,'this is USA') , (4,'China');

//查询临时表创建情况

//注意，这里Created_tmp_disk_tables=4，Created_tmp_tables=10

mysql> show status like '%tmp%';

+-------------------------+-------+

| Variable_name           | Value |

+-------------------------+-------+

| Created_tmp_disk_tables | 4     |

| Created_tmp_files       | 9     |

| Created_tmp_tables      | 10    |

+-------------------------+-------+

//使用group by查询数据

mysql> select * from t1 group by num;

+------+-------------+

| num  | intro       |

+------+-------------+

|    3 | this is USA |

|    4 | China       |

+------+-------------+

2 rows in set (0.05 sec)

//再次查询临时表创建情况

//现在，Created_tmp_disk_tables=5，Created_tmp_tables=11

mysql> show status like '%tmp%';

+-------------------------+-------+

| Variable_name           | Value |

+-------------------------+-------+

| Created_tmp_disk_tables | 5     |

| Created_tmp_files       | 9     |

| Created_tmp_tables      | 11    |

+-------------------------+-------+

2.2、慎用子查询

几乎所有子查询都可以改写为连接查询，有时候，连接查询的效率要比子查询高，所以把子查询改写成连接查询是一个不错的注意。如果一条使用子查询的select语句执行时间过长，那么就应该尝试把它改写为连接查询，看他是不是执行的更好。　　

下例中，我们使用子查询耗时5s，清空缓存后，改用连接查询，只需要0.02s：

//子查询耗时5s

mysql> select * from emp where ename in (select ename from ename);

+--------+--------+----------+-----+------------+---------+--------+--------+

| empno  | ename  | job      | mgr | hiredate   | sal     | comm   | deptno |

+--------+--------+----------+-----+------------+---------+--------+--------+

|      2 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    466 |

|      3 | cAuvTj | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    155 |

|      6 | oOeekL | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |     13 |

|      9 | MFPixN | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    225 |

| 103219 | MfpiXn | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    251 |

| 318098 | mFpIxn | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    480 |

| 333225 | ASOqnr | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    466 |

| 443919 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    446 |

| 458077 | OoeEKL | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    266 |

| 473649 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    448 |

| 769138 | CAUVTJ | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    252 |

| 826307 | MFPixN | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    242 |

+--------+--------+----------+-----+------------+---------+--------+--------+

12 rows in set (5.04 sec)

//清空缓存

reset query cache;

//连接查询耗时0.02s

mysql> select emp.* from emp inner join ename on emp.ename=ename.ename;

+--------+--------+----------+-----+------------+---------+--------+--------+

| empno  | ename  | job      | mgr | hiredate   | sal     | comm   | deptno |

+--------+--------+----------+-----+------------+---------+--------+--------+

|      6 | oOeekL | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |     13 |

| 458077 | OoeEKL | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    266 |

|      9 | MFPixN | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    225 |

| 103219 | MfpiXn | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    251 |

| 318098 | mFpIxn | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    480 |

| 826307 | MFPixN | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    242 |

|      3 | cAuvTj | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    155 |

| 769138 | CAUVTJ | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    252 |

|      2 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    466 |

| 333225 | ASOqnr | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    466 |

| 443919 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    446 |

| 473649 | AsoqNR | SALESMAN |   1 | 2014-10-29 | 2000.00 | 400.00 |    448 |

+--------+--------+----------+-----+------------+---------+--------+--------+

12 rows in set (0.02 sec)

2.3、在DISTINCT列上增加索引

如果在distinct列上不增加索引，那么mysql在查询时将创建临时表；如果我们在该列上增加索引，可以避免使用临时表：

create table message(

	user_id int,

	group_id int

);

//插入10条数据

insert into message values(24,67),(15,76),(134,986),(6,98),(46,988),(13,2),(12,89),(17,34),(63,19),(92,74);

//没加索引，extra中有using temporary

mysql> explain select distinct user_id from message where group_id=2\G;

*************************** 1. row ***************************

           id: 1

  select_type: SIMPLE

        table: message

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 12

        Extra: Using where; Using temporary

1 row in set (0.01 sec)

//增加索引

create index KEY_GID_UID on message (group_id, user_id);

//加了索引之后，终于不用创建临时表了

mysql> explain select distinct user_id from message where group_id=2\G;

*************************** 1. row ***************************

           id: 1

  select_type: SIMPLE

        table: message

         type: ref

possible_keys: KEY_GID_UID

          key: KEY_GID_UID

      key_len: 5

          ref: const

         rows: 1

        Extra: Using where; Using index

1 row in set (0.00 sec)

2.4、在group by后面增加order by null

在使用group by分组查询时，默认分组后，还会排序，可能会降低速度。如果不需要排序，那么可以在group by后面增加order by null，这样可以避免分组后排序：

//注意，没加order by null时，extra中有Using filesort

mysql> explain select * from emp group by deptno\G;

*************************** 1. row ***************************

           id: 1

  select_type: SIMPLE

        table: emp

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 4296846

        Extra: Using temporary; Using filesort

//加了order by null后，extra中就没有Using filesort了

mysql> explain select * from emp group by deptno order by null\G;

*************************** 1. row ***************************

           id: 1

  select_type: SIMPLE

        table: emp

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 4354494

        Extra: Using temporary

1 row in set (0.00 sec)

MYSQL学习笔记——数据库范式及MYSQL优化整体思路的更多相关文章

MySQL学习笔记-数据库文件
数据库文件 MySQL主要文件类型有如下几种参数文件:my.cnf--MySQL实例启动的时候在哪里可以找到数据库文件,并且指定某些初始化参数,这些参数定义了某种内存结构的大小等设置,还介绍了参数类 ...
MySQL学习笔记-数据库内存
数据库内存 InnoDB存储引擎内存由以下几个部分组成:缓冲池(buffer pool).重做日志缓冲池(redo log buffer)以及额外的内存池(additional memory pool ...
MySQL学习笔记-数据库后台线程
数据库后台线程默认情况下讲述的InnoDB存储引擎,以后不再重复声明.后台线程有7个--4个IO thread,1个master thread,1个锁监控线程,1个错误监控线程.IO thread的 ...
MySQL学习笔记（三）数据优化
第1章数据库优化简介1-1 MySQL优化简介第2章 SQL语句优化2-1 数据准备 2-2 MySQL慢查日志的开启方式 2-3 MySQL慢查日志分析工具之 mysqldumpslow www ...
MySQL学习笔记之中的一个 MySQL入门
本人之前接触的关系型数据库主要是oracle和sqlserver,而对于mysql知之甚少,但查阅网上资料发现,mysql与oracle非常相似,所以学起来应该不会非常费劲,在总结的时候可能很多其它的 ...
mysql学习笔记（七）—— MySQL内连接和外连接
MySQL内连接(inner join on) MySQL的内连接使用inner join on,它的效果跟使用where是一样的,如果联结的是两个表,那么需要左右的条件或者说字段是需要完全匹 ...
MySQL学习笔记（二）性能优化的笔记（转）
今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显.关于数据库的性能,这并不只是DBA才需要担心的事,而这更是我们程序员需要去关注的事情.当我们去设计数据库表结构,对操作数据 ...
mysql学习笔记--数据库操作
一.显示数据库 show databases; 二.创建数据库 create database [if not exists] 数据库名 [字符编码] 注意: a. 如果已经存在数据库再创建会报错 b ...
【PHP+MySQL学习笔记】php操作MySQL数据库中语句
1.连接 MYSQL 服务器的函数 mysql_connect();<?php $con = mysql_connect("localhost","root&quo ...

随机推荐

Matlab中imfilter()函数的用法
Matlab中imfilter()函数的用法功能:对任意类型数组或多维图像进行滤波.用法:B = imfilter(A,H) B = imfilter(A,H,option1,option2,... ...
Retrotranslator使用简介(JDK1.5->1.4）
Retrotranslator是一个可以把JDK1.5(6)下编译的类(或包)转译成JDK1.4下可以识别的类(包)的工具. 为现在还用JDK1.4呢?我想无非是现在的大部分Java Web应用是 ...
CS2001 VS编译错误
Severity Code Description Project File Line Suppression State Error CS2001 Source file 'C:\Workspace ...
任何国家都无法限制数字货币。为什么呢？要想明白这个问题需要具备一点区块链的基础知识：区块链使用的大致技术包括以下几种： a.点对点网络设计 b.加密技术应用 c.分布式算法的实现 d.数据存储技术 e.拜占庭算法 f.权益证明POW,POS,DPOS 原因一：点对点网络设计其中点对点的P2P网络是bittorent ，由于是点对点的网络，没有中心化，因此在全球分布式的网
任何国家都无法限制数字货币.为什么呢? 要想明白这个问题需要具备一点区块链的基础知识: 区块链使用的大致技术包括以下几种: a.点对点网络设计 b.加密技术应用 c.分布式算法的实现 d.数据存储技 ...
navigator组件（相当于a标签）
navigator组件:页面链接: navigator组件属性: target:类型字符串在哪个目标上发生跳转,默认当前小程序属性值:self 当前小程序 miniProgram 其他小程序 u ...
zabbix主动、被动TCP连接过程
zabbix主动.被动TCP连接过程 https://blog.csdn.net/u010668387/article/details/79460183
5个用/不用GraphQL的理由
我在如何使用Gatsby建立博客 / How to build a blog with Gatsby这篇文章中提过GraphQL在Gatsby中的应用.总的来讲,它是一个新潮的技术,在适宜的使用场景威 ...
最新版本的MySQL的下载和安装(Release: 8.0.12)
1.打开百度搜索[Myql],或直达官网https://dev.mysql.com/ 2.点选[Download按钮],跳转到下载页面,拉到底部再点选[Community Download]社区版[免 ...
Android流媒体开发之路三:基于NDK开发Android平台RTSP播放器
基于NDK开发Android平台RTSP播放器最近做了不少android端的开发,有推流.播放.直播.对讲等各种应用,做了RTMP.RTSP.HTTP-FLV.自定义等各种协议,还是有不少收获和心得 ...
loj#6487 基础 FFT 练习题
分析仔细观察a[i],b[i]的数据范围于是我们转为枚举所有a[i],b[i]的值然后暴力即可代码 #include<bits/stdc++.h> using namespace ...

MYSQL学习笔记——数据库范式及MYSQL优化整体思路

MYSQL学习笔记——数据库范式及MYSQL优化整体思路的更多相关文章

随机推荐

热门专题