一、数据库范式                                                                              

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

1.1、第一范式(1NF:每一列不可包含多个值)
      所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。
      在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。

1.2、第二范式(2NF:非主属性部分依赖于主关键字)
      第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。
      第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是非主属性部分依赖于主关键字。

1.3、第三范式(3NF:属性不依赖于其它非主属性)
      满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。

1.4、反三范式(反3NF:为了性能,增加冗余)

3NF提出目的是为了降低冗余,减少不必要的存储,这对于存储设备昂贵的过去是很有必要的,但是随着存储设备的降价以及人们对性能的不断提高,又有人提出反三范式。

所谓反三范式就是为了性能,增加冗余。以部门信息表为例,每个部门有部门编号、部门名称、部门简介等信息,按照3NF的要求,为了避免冗余,我们在员工表中就不应该加入部门名称、部门简介等部门有关信息,带来的代价是每次都要查询两次数据库。反三范式允许我们冗余重要信息到员工表中,例如部门名称,这样我们每次取员工信息时就能直接取出部门名称,不需要查询两次数据库,提升了程序性能。

二、MYSQL优化整体思路                                                                     

MYSQL优化首先应该定位问题,可能导致MYSQL低性能的原因有:业务逻辑过多的查询、表结构不合理、sql语句优化以及硬件优化,从优化效果来看,这四个优化点的优化效果依次降低:理清业务逻辑能够帮助我们避免不必要的查询,合理设计表结构也能帮助我们少查询数据库。对于sql语句优化,我们可以先使用慢查询日志(慢查询日志的使用:http://www.cnblogs.com/timlearn/p/4052523.html)定位慢查询,然后针对该查询进行优化,最常见且最有效的优化范式就是增加合理的索引,这个在上篇博客http://www.cnblogs.com/timlearn/p/4055512.html已经讲解,本篇博客将讲解其他一些优化手段或者注意点。

2.1、谨慎使用TEXT/BLOB类型

当列类型是TEXT或者BLOB时,我们应该特别注意,因为当选择的字段有 text/blob 类型的时候,无法创建内存表,只能创建硬盘临时表,而硬盘临时表的性能比内存表的性能差,所以如果非要使用TEXT/BLOB类型,应该单独建表,不要把TEXT/BLOB类型与核心属性混合在一张表中。对此,做一个实验如下:

//创建数据表
create table t1 (
num int,
intro text(1000)
); //插入数据
insert into t1 values (3,'this is USA') , (4,'China'); //查询临时表创建情况
//注意,这里Created_tmp_disk_tables=4,Created_tmp_tables=10
mysql> show status like '%tmp%';
+-------------------------+-------+
| Variable_name | Value |
+-------------------------+-------+
| Created_tmp_disk_tables | 4 |
| Created_tmp_files | 9 |
| Created_tmp_tables | 10 |
+-------------------------+-------+ //使用group by查询数据
mysql> select * from t1 group by num;
+------+-------------+
| num | intro |
+------+-------------+
| 3 | this is USA |
| 4 | China |
+------+-------------+
2 rows in set (0.05 sec) //再次查询临时表创建情况
//现在,Created_tmp_disk_tables=5,Created_tmp_tables=11
mysql> show status like '%tmp%';
+-------------------------+-------+
| Variable_name | Value |
+-------------------------+-------+
| Created_tmp_disk_tables | 5 |
| Created_tmp_files | 9 |
| Created_tmp_tables | 11 |
+-------------------------+-------+

2.2、慎用子查询

几乎所有子查询都可以改写为连接查询,有时候,连接查询的效率要比子查询高,所以把子查询改写成连接查询是一个不错的注意。如果一条使用子查询的select语句执行时间过长,那么就应该尝试把它改写为连接查询,看他是不是执行的更好。  

下例中,我们使用子查询耗时5s,清空缓存后,改用连接查询,只需要0.02s:

//子查询耗时5s
mysql> select * from emp where ename in (select ename from ename);
+--------+--------+----------+-----+------------+---------+--------+--------+
| empno | ename | job | mgr | hiredate | sal | comm | deptno |
+--------+--------+----------+-----+------------+---------+--------+--------+
| 2 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 466 |
| 3 | cAuvTj | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 155 |
| 6 | oOeekL | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 13 |
| 9 | MFPixN | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 225 |
| 103219 | MfpiXn | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 251 |
| 318098 | mFpIxn | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 480 |
| 333225 | ASOqnr | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 466 |
| 443919 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 446 |
| 458077 | OoeEKL | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 266 |
| 473649 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 448 |
| 769138 | CAUVTJ | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 252 |
| 826307 | MFPixN | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 242 |
+--------+--------+----------+-----+------------+---------+--------+--------+
12 rows in set (5.04 sec) //清空缓存
reset query cache; //连接查询耗时0.02s
mysql> select emp.* from emp inner join ename on emp.ename=ename.ename;
+--------+--------+----------+-----+------------+---------+--------+--------+
| empno | ename | job | mgr | hiredate | sal | comm | deptno |
+--------+--------+----------+-----+------------+---------+--------+--------+
| 6 | oOeekL | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 13 |
| 458077 | OoeEKL | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 266 |
| 9 | MFPixN | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 225 |
| 103219 | MfpiXn | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 251 |
| 318098 | mFpIxn | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 480 |
| 826307 | MFPixN | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 242 |
| 3 | cAuvTj | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 155 |
| 769138 | CAUVTJ | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 252 |
| 2 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 466 |
| 333225 | ASOqnr | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 466 |
| 443919 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 446 |
| 473649 | AsoqNR | SALESMAN | 1 | 2014-10-29 | 2000.00 | 400.00 | 448 |
+--------+--------+----------+-----+------------+---------+--------+--------+
12 rows in set (0.02 sec)

2.3、在DISTINCT列上增加索引

如果在distinct列上不增加索引,那么mysql在查询时将创建临时表;如果我们在该列上增加索引,可以避免使用临时表:

create table message(
user_id int,
group_id int
); //插入10条数据
insert into message values(24,67),(15,76),(134,986),(6,98),(46,988),(13,2),(12,89),(17,34),(63,19),(92,74); //没加索引,extra中有using temporary
mysql> explain select distinct user_id from message where group_id=2\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: message
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 12
Extra: Using where; Using temporary
1 row in set (0.01 sec) //增加索引
create index KEY_GID_UID on message (group_id, user_id); //加了索引之后,终于不用创建临时表了
mysql> explain select distinct user_id from message where group_id=2\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: message
type: ref
possible_keys: KEY_GID_UID
key: KEY_GID_UID
key_len: 5
ref: const
rows: 1
Extra: Using where; Using index
1 row in set (0.00 sec)

2.4、在group by后面增加order by null

在使用group by分组查询时,默认分组后,还会排序,可能会降低速度。如果不需要排序,那么可以在group by后面增加order by null,这样可以避免分组后排序:

//注意,没加order by null时,extra中有Using filesort
mysql> explain select * from emp group by deptno\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: emp
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 4296846
Extra: Using temporary; Using filesort //加了order by null后,extra中就没有Using filesort了
mysql> explain select * from emp group by deptno order by null\G;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: emp
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 4354494
Extra: Using temporary
1 row in set (0.00 sec)

MYSQL学习笔记——数据库范式及MYSQL优化整体思路的更多相关文章

  1. MySQL学习笔记-数据库文件

    数据库文件 MySQL主要文件类型有如下几种 参数文件:my.cnf--MySQL实例启动的时候在哪里可以找到数据库文件,并且指定某些初始化参数,这些参数定义了某种内存结构的大小等设置,还介绍了参数类 ...

  2. MySQL学习笔记-数据库内存

    数据库内存 InnoDB存储引擎内存由以下几个部分组成:缓冲池(buffer pool).重做日志缓冲池(redo log buffer)以及额外的内存池(additional memory pool ...

  3. MySQL学习笔记-数据库后台线程

    数据库后台线程 默认情况下讲述的InnoDB存储引擎,以后不再重复声明.后台线程有7个--4个IO thread,1个master thread,1个锁监控线程,1个错误监控线程.IO thread的 ...

  4. MySQL学习笔记(三)数据优化

    第1章 数据库优化简介1-1 MySQL优化简介 第2章 SQL语句优化2-1 数据准备 2-2 MySQL慢查日志的开启方式 2-3 MySQL慢查日志分析工具之 mysqldumpslow www ...

  5. MySQL学习笔记之中的一个 MySQL入门

    本人之前接触的关系型数据库主要是oracle和sqlserver,而对于mysql知之甚少,但查阅网上资料发现,mysql与oracle非常相似,所以学起来应该不会非常费劲,在总结的时候可能很多其它的 ...

  6. mysql学习笔记(七)—— MySQL内连接和外连接

        MySQL内连接(inner join on) MySQL的内连接使用inner join on,它的效果跟使用where是一样的,如果联结的是两个表,那么需要左右的条件或者说字段是需要完全匹 ...

  7. MySQL学习笔记(二)性能优化的笔记(转)

    今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显.关于数据库的性能,这并不只是DBA才需要担心的事,而这更是我们程序员需要去关注的事情.当我们去设计数据库表结构,对操作数据 ...

  8. mysql学习笔记--数据库操作

    一.显示数据库 show databases; 二.创建数据库 create database [if not exists] 数据库名 [字符编码] 注意: a. 如果已经存在数据库再创建会报错 b ...

  9. 【PHP+MySQL学习笔记】php操作MySQL数据库中语句

    1.连接 MYSQL 服务器的函数 mysql_connect();<?php $con = mysql_connect("localhost","root&quo ...

随机推荐

  1. JS判断Android、iOS或浏览器的多种方法(四种方法)

    第一种:通过判断浏览器的userAgent,用正则来判断是否是ios和Android客户端. 代码如下: <script type="text/javascript"> ...

  2. 解决 ffmpeg 在avformat_find_stream_info执行时间太长

    用ffmpeg做demux,网上很多参考文章.对于网络流,avformt_find_stream_info()函数默认需要花费较长的时间进行流格式探测,那么,如何减少探测时间内? 可以通过设置AVFo ...

  3. 阶段1 语言基础+高级_1-3-Java语言高级_1-常用API_1_第1节 Scanner类_2-概述及其API文档

    键盘输入的类 Scanner首字母是大写的S.说明这是一个类,并不是关键字.关键字都是小写的.这个类是jdk中已经提供好的 1.看包 2.构造方法. 3.方法 只要不是引用类型,就是基本类型

  4. Java各类型占字节数

    byte 1字节short 2字节int 4字节long 8字节float 4字节double 8字节char 2字节boolean 1字节 其中,换算关系: 1GB=1024MB 1MB=1024K ...

  5. LDA提取信息

    文本主题模型提取 如下程序将句子主题提取后,将权重值存入dataframe. #!/usr/bin/python # -*- coding:utf-8 -*- import pandas as pd ...

  6. Winform 开源控件库( Sheng.Winform.Controls)

    升讯威 .Net WinForm 控件库提供了超过15种 Winform 控件,你可以直接使用本控件库,更可以通过本控件库学到 Winform 控件开发的方法和理念. 你可以学习到: 如何基于 Con ...

  7. It's strange. I felt less lonely when I didnt know you.

    feasible:adj. 可行的 bypass: v. 绕开,避开 eclipse: n. 月食 raw: adj. 生的 foresee:v. 预见 premier:n. 总理 ,adj: 首要的 ...

  8. TensorFlow学习笔记4-线性代数基础

    TensorFlow学习笔记4-线性代数基础 本笔记内容为"AI深度学习".内容主要参考<Deep Learning>中文版. \(X\)表示训练集的设计矩阵,其大小为 ...

  9. 001--PowerDesigner连接MySQL

    PowerDesigner连接MySQL(一) 博客地址:https://blog.csdn.net/codemonkey_king/article/details/53263597 https:// ...

  10. JavaScript求两点之间相对于Y轴的顺时针旋转角度

    需求: 已知一个向量,初始位置在y轴方向,如图红色箭头,绕中心点(x1, y1)旋转若干角度后,到达Line(x2,y2 x1,y1)的位置,求旋转角度 分析: 坐标点(x1, y1)(x2, y2) ...