一、数据类型优化

1、更小通常更好

应该尽量使用可以正确存储数据的最小数据类型，更小的数据类型通常更快，因为它们占用更少的磁盘、内存和CPU缓存，并且处理时需要的CPU周期更少，但是要确保没有低估需要存储的值的范围，如果无法确认哪个数据类型，就选择认为不会超过范围的最小类型。

案例：设计两张表，设计不同的数据类型，查看表的容量

2、简单就好

简单数据类型的操作通常需要更少的CPU周期，例如，

1、整型比字符操作代价更低，因为字符集和校对规则是字符比较比整型比较更复杂

2、使用mysql自建类型而不是字符串来存储日期和时间

3、用整型存储IP地址

案例：创建两张相同的表，改变日期的数据类型，查看SQL语句执行的速度

3、尽量避免null

如果查询中包含可为NULL的列，对mysql来说很难优化，因为可为null的列使得索引、索引统计和值比较都更加复杂，坦白来说，通常情况下null的列改为not null带来的性能提升比较小，所有没有必要将所有的表的schema进行修改，但是应该尽量避免设计成可为null的列

4、实际规则

(1)整数类型

可以使用的几种整数类型：TINYINT，SMALLINT，MEDIUMINT，INT，BIGINT分别使用8，16，24，32，64位存储空间。

尽量使用满足需求的最小数据类型

(2)字符和字符串类型

1、char长度固定，即每条数据占用等长字节空间；最大长度是255个字符，适合用在身份证号、手机号等定长字符串

2、varchar可变程度，可以设置最大长度；最大空间是65535个字节，适合用在长度可变的属性

3、text不设置长度，当不知道属性的最大长度时，适合用text

按照查询速度：char>varchar>text

varchar根据实际内容长度保存数据

使用最小的符合需求的长度。
varchar(n) n小于等于255使用额外一个字节保存长度，n>255使用额外两个字节保存长度。
varchar(5)与varchar(255)保存同样的内容，硬盘存储空间相同，但内存空间占用不同，是指定的大小。
varchar在mysql5.6之前变更长度，或者从255一下变更到255以上时时，都会导致锁表。
应用场景:
1. 存储长度波动较大的数据，如：文章，有的会很短有的会很长
2. 字符串很少更新的场景，每次更新后都会重算并使用额外存储空间保存长度
3. 适合保存多字节字符，如：汉字，特殊字符等

char固定长度的字符串

最大长度：255
会自动删除末尾的空格
检索效率、写效率会比varchar高，以空间换时间
应用场景:

存储长度波动不大的数据，如：md5摘要

存储短字符串、经常更新的字符串

(3)BLOB和TEXT类型

MySQL 把每个 BLOB 和 TEXT 值当作一个独立的对象处理。

两者都是为了存储很大数据而设计的字符串类型，分别采用二进制和字符方式存储。

(4)datetime和timestamp

① datetime

占用8个字节
与时区无关，数据库底层时区配置，对datetime无效
可保存到毫秒
可保存时间范围大
不要使用字符串存储日期类型，占用空间大，损失日期类型函数的便捷性

② timestamp

占用4个字节
时间范围：1970-01-01到2038-01-19
精确到秒
采用整形存储
依赖数据库设置的时区
自动更新timestamp列的值

③ date

占用的字节数比使用字符串、datetime、int存储要少，使用date类型只需要3个字节
使用date类型还可以利用日期时间函数进行日期之间的计算
date类型用于保存1000-01-01到9999-12-31之间的日期

(5)使用枚举代替字符串类型

有时可以使用枚举类代替常用的字符串类型，mysql存储枚举类型会非常紧凑，会根据列表值的数据压缩到一个或两个字节中，mysql在内部会将每个值在列表中的位置保存为整数，并且在表的.frm文件中保存“数字-字符串”映射关系的查找表

 create table enum_test(e enum('fish','apple','dog') not null);

 insert into enum_test(e) values('fish'),('dog'),('apple');

 select e+0 from enum_test;

(6)特殊类型数据

人们经常使用varchar(15)来存储ip地址，然而，它的本质是32位无符号整数不是字符串，可以使用INET_ATON()和INET_NTOA函数在这两种表示方法之间转换

案例：

select inet_aton('1.1.1.1')

select inet_ntoa(16843009)

二、合理使用范式以及反范式

1、三范式

1NF:列不可分

2NF:在1NF前提下,表只描述一件事,即没有部分依赖

3NF:在2NF前提下,没有传递依赖

目的:降低表格数据冗余度

2、范式优点以及缺点

优点

范式化的更新通常比反范式要快

当数据较好的范式化后，很少或者没有重复的数据

范式化的数据比较小，可以放在内存中，操作比较快

缺点

由于表格数据冗余度降低,所以查询时经常涉及到关联查询(消耗性能)。

3、反范式优点以及缺点

优点

所有的数据都在同一张表中，可以避免关联

可以设计有效的索引

缺点

表格内的冗余较多，删除数据时候会造成表有些有用的信息丢失

4、范式反范式注意事项

在企业中很好能做到严格意义上的范式或者反范式，一般需要混合使用
在一个网站实例中，这个网站，允许用户发送消息，并且一些用户是付费用户。现在想查看付费用户最近的10条信息。在user表和message表中都存储用户类型(account_type)而不用完全的反范式化。这避免了完全反范式化的插入和删除问题，因为即使没有消息的时候也绝不会丢失用户的信息。这样也不会user_message表搞得太大，有利于高效地获取数据。
从父表冗余一些数据到子表的理由是排序的需要。
缓存衍生值也是有用的。如果需要显示每个用户发了多少消息（类似论坛的），可以每次执行一个昂贵的自查询来计算并显示它；也可以在user表中建一个num_messages列，每当用户发新消息时更新这个值。

5、案例

范式设计

反范式设计

三、主键的选择

1、代理主键

与业务无关的，无意义的数字序列,比如自增的id等

2、自然主键

事物属性中的自然唯一标识,比如人的身份证号

3、推荐使用代理主键

它们不与业务耦合，因此更容易维护
一个大多数表，最好是全部表，通用的键策略能够减少需要编写的源码数量，减少系统的总体拥有成本

四、字符集的选择

1、字符集设置

参考:MySQL数据库端字符集设置

2、关于字符集之间差异

参考:(精)字符集GBK和UTF8的区别说明

3、字符集选择规则

字符集直接决定了数据在MySQL中的存储编码方式，由于同样的内容使用不同字符集表示所占用的空间大小会有较大的差异，所以通过使用合适的字符集，可以帮助我们尽可能减少数据量，进而减少IO操作次数。

1.纯拉丁字符能表示的内容，没必要选择 latin1 之外的其他字符编码，因为这会节省大量的存储空间。

2.如果我们可以确定不需要存放多种语言，就没必要非得使用UTF8或者其他UNICODE字符类型，这回造成大量的存储空间浪费。

3.MySQL的数据类型可以精确到字段，所以当我们需要大型数据库中存放多字节数据的时候，可以通过对不同表不同字段使用不同的数据类型来较大程度减小数据存储量，进而降低 IO 操作次数并提高缓存命中率。

五、存储引擎的选择

MyISAM不支持事务、不支持行锁、不支持外键

六、适当的数据冗余

1.被频繁引用且只能通过 Join 2张(或者更多)大表的方式才能得到的独立小字段。

2.这样的场景由于每次Join仅仅只是为了取得某个小字段的值，Join到的记录又大，会造成大量不必要的 IO，完全可以通过空间换取时间的方式来优化。不过，冗余的同时需要确保数据的一致性不会遭到破坏，确保更新的同时冗余字段也被更新。

七、适当拆分

当我们的表中存在类似于 TEXT 或者是很大的 VARCHAR类型的大字段的时候，如果我们大部分访问这张表的时候都不需要这个字段，我们就该义无反顾的将其拆分到另外的独立表中，以减少常用数据所占用的存储空间。这样做的一个明显好处就是每个数据块中可以存储的数据条数可以大大增加，既减少物理 IO 次数，也能大大提高内存中的缓存命中率。

MySQL设计之Schema与数据类型优化的更多相关文章

mysql笔记01 MySQL架构与历史、Schema与数据类型优化
MySQL架构与历史 1. MySQL架构推荐参考:http://www.cnblogs.com/baochuan/archive/2012/03/15/2397536.html 2. MySQL会解 ...
MySQL Schema与数据类型优化
Schema与数据类型优化选择优化的数据类型 1.更小的通常更好更小的数据类型通常更快,因为它们占用更少的磁盘,内存和CPU缓存 2.简单就好简单数据类型的操作通常需要更少的CPU周期.例如:整 ...
Schema 与数据类型优化
这是<高性能 MySQL(第三版)>第四章<Schema 与数据类型优化>的读书笔记. 1. 选择优化的数据类型数据类型的选择原则: 越小越好:选择满足需求的最小类型.注意, ...
高性能MySQL笔记第4章 Schema与数据类型优化
4.1 选择优化的数据类型通用原则更小的通常更好前提是要确保没有低估需要存储的值范围:因为它占用更少的磁盘.内存.CPU缓存,并且处理时需要的CPU周期也更少. 简单就好简 ...
MySQL Schema 与数据类型优化
良好的逻辑设计和物理设计是高性能的基石,应该根据系统将要执行的查询语句来设计schema,这往往需要权衡各种因素. 例如,反范式的设计可以加快某些类型的查询,但同时可能使另一些类型的查询变慢:添加计数 ...
Schema与数据类型优化
良好的逻辑设计和物理设计是高性能的基石,应该根据系统将要执行的查询数据来设计schema,这往往需要权衡各种因素. MySQL支持的数据类型非常多,选择正确的数据类型对于获得高性能至关重要. 更小的通 ...
Mysql高性能笔记（一）:Schema与数据类型优化
1.数据类型 1.1.几个参考优化原则 a. 更小的通常更好 i.更小的数据类型,占用更少磁盘.内存和CPU缓存,需要的CPU周期更少 ii.如果无法确定哪个数据类型是最好的,就选择不会超过范围的最 ...
MySQL之Schema与数据类型优化
选择优化的数据类型 MySQL支持的数据类型非常多,选择正确的数据类型对于获得高性能至关重要.不管存储哪种类型的数据,下面几个简单的原则都有助于做出更好的选择: 更小的通常更好一般情况下,应该尽量使用 ...
深入学习MySQL 03 Schema与数据类型优化
Schema是什么鬼 schema就是数据库对象的集合,这个集合包含了各种对象如:表.视图.存储过程.索引等.为了区分不同的集合,就需要给不同的集合起不同的名字,默认情况下一个用户对应一个集合,用户的 ...

随机推荐

图解Python中深浅拷贝
在工作中,常涉及到数据的传递,在数据传递使用过程中,可能会发生数据被修改的问题.为了防止数据被修改,就需要在传递一个副本,即使副本被修改,也不会影响原数据的使用.为了生成这个副本,就产生了拷贝.今天就 ...
设置Safari禁止访问某个网站
经过调查有三种方法可以做到:1,创立新的登录账户,然后进行家长控制:2,安装第三方的应用软件Self Control:3,其他方式推荐大家使用下面的这个方式:三步即可 1:打开访达(Finder), ...
SSM框架实现多张图片和其他数据一起上传
一.SSM+Form 多张图片和其他数据一起上传, 1.导包: commons-fileupload-1.3.3.jar commons-io-2.4.jar 2.springmvc.xml 文件配置 ...
SQL Server中模式（schema）、数据库（database）、表（table）、用户（user）之间的关系
数据库的初学者往往会对关系型数据库模式(schema).数据库(database).表(table).用户(user)之间感到迷惘,总感觉他们的关系千丝万缕,但又不知道他们的联系和区别在哪里,对一些问 ...
hbase：ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet
hbase连接deug:DEBUG [main-SendThread(bigdata.server1:2181)] - Reading reply sessionid:0x16f764e7f6e000 ...
Java并发编程实战（3）- 互斥锁
我们在这篇文章中主要讨论如何使用互斥锁来解决并发编程中的原子性问题. 目录概述互斥锁模型互斥锁简易模型互斥锁改进模型 Java世界中的互斥锁 synchronized中的锁和锁对象 synch ...
MySQL更新勿用and
项目实战一次错误的更新更新前的数据执行更新语句然后我们查看下更新后的数据,发现居然数据为空? 使用主键id的方式查询这条数据,发现需要更新的手机号码居然变为了0 当我们把更新语句中的and ...
Sql Server Sum函数的特殊使用
利用Sql Server的Sum函数开窗得到累计值具体详解https://www.cnblogs.com/zhaoshujie/p/9594676.html 个人示例例子 DECLARE @Sale ...
Java的nanoTime()方法
java有两个获取和时间相关的秒数方法,一个是广泛使用的 System.currentTimeMillis() 返回的是从一个长整型结果,表示毫秒. 另一个是 System.nanoTime() 返回 ...
java进阶(29)--HashMap集合
一.HashMap简介 1.HashMap底层是哈希表结构,类似字典,初始化如下: 2.哈希表结构: 是一个数组+单向链表的结构体数组:查询效率较高,随机增删效率很低单向链表:在随机增删方面效率较 ...

MySQL设计之Schema与数据类型优化