MySQL性能优化--优化数据库结构之优化数据大小

 

By:授客  QQ1033553122

尽量减少表占用的磁盘空间。通常,执行查询期间处理表数据时,小表占用更少的内存。

表列

l   尽可能使用最效率(最小)的数据类型。比如,使用更小的整型以便于获取更小的表。相比INT,MEDIUMINT 通常是个更好的选择,因为MEDIUMINT列少使用25%的空间。

l   尽可能的定义列为NOT NULL,这有利于更好的使用索引,可以让sql操作更快。

行格式

l   MySQL 5.7.8及以前版本,默认的,以COMPACT行格式创建InnoDB表。从5.7.9开始,默认行格式为DYNAMIC。可通过配置innodb_default_row_format来修改默认行格式。

同时,也可以通过执行CREATE TABLE、ALTER TABLE命令时指定ROW_FORMAT选项显示指定行格式化。

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/innodb-row-format-specification.html

COMPACT行格式可减少大约20%的行存储空间, 代价是,针对某些操作,会增加CPU使用。如果工作任务由缓存命中率和磁盘速度限制,使用COMPACT可能会更快,,极少情况下,由CUP限制,可能会更慢。

同时,COMPACT行格式也会影响utf8或utf8mb4数据在CHAR类型列中的存储。针对ROW_FORMAT=REDUNDANT,一个utf8、utf8mb4 CHAR(N) 列,占用“最大字符的字节长度” X N 字节。 而许多语言主要使用单字节的utf8、utf8mb4字符,所以固定长度的存储通常会浪费空间。针对ROW_FORMAT=COMPACT, InnoDB为这些列分配可变存储量,必要的话,过去掉尾部空格。最小的存储长度保存为N个字节。更多资料,查阅

http://dev.mysql.com/doc/refman/5.7/en/innodb-physical-record.html

l   在创建表时指定ROW_FORMAT=COMPRESSED,或者对已存在MyISAM表执行myisampack命令,以压缩形式存储表数据,可更进一步的最小化空间(被压缩的InnoDB表可读可写,但是被压缩的MyISAM表只可读)。

l   针对MyISAM表,如果没有可变长度列(VARCHAR,TEXT、BLOB列),将使用fixed-size列格式。这个速度比较快,但是会浪费一些空间。查看Section 16.2.3, “MyISAM Table Storage Formats”。即使有VARCHAR列,也可以在执行CREATE TABLE命令时使用ROW_FORMAT=FIXED显示指定使用固定长度列。

索引

l   表的主索引(primary index)(所占的空间)要尽可能短。这使得行记录的识别容易而且有效率。对于InnoDB表,主索引列也存在于每个二级索引(second index)条目中,所以如果有很多二级索引的话,短的主索引可以节省大量的空间。

注:

主索引:指在指定的索引字段或表达式中不允许出现重复值的索引

参考连接:

http://baike.baidu.com/link?url=R3TFNWDpGZU9kAioDFcC5LyPLJLy-RzjY1ZMuVyJHN1j3zmKnxOBE3U2dtaT9cG53dkIM2o76li0mLXNzVpDZa

更多说明,参考文章:“MySQL InnoDB表和索引之聚簇索引与第二索引

l   仅在需要提高查询性能时创建索引。索引有利于检索,但是会减慢插入和更新操作的速度。如果大部分情况下都是通过在组合列(combinnation of columns)上搜索进行表访问,那么应该在该组合列上建立索引,而不是为组合列中的每个建立单独的索引。索引的第一部分即第一列,应该是用得最多的列。

l   很有可能,一个很长的字符串列,拥有一个唯一的前缀,最好仅索引该前缀(语法支持,具体查看 Section 14.1.14, “CREATE INDEX Syntax”)。索引越短,检索越快,不仅仅是因为其需要更少的磁盘空间,还因为在索引缓存中提供了更多的命中,进而减少磁盘搜索(disk seeks)。

eg:仅用name列的前10个字符创建索引

CREATE INDEX part_of_name ON customer (name(10));

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/create-index.html

Join

l   某些情况,把一张经常被扫描的表拆分成两张表是很有好处的,特别是动态格式化表,并且在扫描时,可能用一个更小的统计格式表来查询相关行

注:

动态格式化表:包含长度可变的列,或者使用ROW_FORMAT=DYNAMIC选项创建的表

参考连接:

http://dev.mysql.com/doc/refman/5.5/en/dynamic-format.html

l   不同表中用相同的数据类型声明携带相同信息的数据列,加快基于对应列的join速度。

l   尽量保持列名的简单,这样,可以跨越不同的表使用相同的名字,并简化join查询。比如,某个名为customer表中,使用列名 name ,而不是customer_name。为了使列名兼容它sql服务器,考虑保持列名少于18个字符。

标准化

l   正常,尽量保持数据不重复。赋予列名唯一ID,有必要的话,在其它更小表中使用这些id,而不是重复冗长的值,比如名称和地址,join子句中通过引用这些id来join表。

l   如果速度比磁盘空间,保存多份数据副本的维护成本更重要,例如,在一个商业智能场景中,分析来自大表的所有数据,可以适当放宽标准化规则,冗余数据信息或创建汇总表以获取更快的速度。

参考连接:

http://dev.mysql.com/doc/refman/5.7/en/data-size.html

MySQL 性能优化--优化数据库结构之优化数据大小的更多相关文章

  1. MySQL 性能优化--优化数据库结构之优化数据类型

    MySQL性能优化--优化数据库结构之优化数据类型   By:授客  QQ:1033553122   优化数字数据(Numeric Data) l   对于唯一ID或其它可用字符串或数字表示的值,选择 ...

  2. 【MySQL优化】数据库结构优化

    原则: 设计表结构,字段类型,最小化磁盘存储的空间,减少IO.数据库操作中最为耗时的操作就是 IO 处理,大部分数据库操作 90% 以上的时间都花在了 IO 读写上面.所以尽可能减少 IO 读写量,可 ...

  3. MySql(十一):MySQL性能调优——常用存储引擎优化

    一.前言 MySQL 提供的非常丰富的存储引擎种类供大家选择,有多种选择固然是好事,但是需要我们理解掌握的知识也会增加很多.本章将介绍最为常用的两种存储引擎进行针对性的优化建议. 二.MyISAM存储 ...

  4. CodeFirstMigrations更新数据库结构(EF数据迁移)

    背景 code first起初当修改model后,要持久化至数据库中时,总要把原数据库给删除掉再创建(DropCreateDatabaseIfModelChanges),此时就会产生一个问题,当我们的 ...

  5. 查询sqlserver数据库,表占用数据大小

     if exists(select 1 from tempdb..sysobjects where id=object_id('tempdb..#tabName') and xtype='u')dro ...

  6. mysql数据优化--数据库结构的优化

    1,比如存时间类型的就使用int类型   其中mysql的两个函数可以拿来使用 unix_timestamp 将时间日期转化为时间戳

  7. mysql性能优化学习笔记-参数介绍及优化建议

    MySQL服务器参数介绍 mysql参数介绍(客户端中执行),尽量只修改session级别的参数. 全局参数(新连接的session才会生效,原有已经连接的session不生效) set global ...

  8. MySQL-快速入门(14)MySQL性能优化

    1.MySQL性能优化包括查询速度优化.数据库结构优化.数据库服务器优化等. 优化的切入点:合理的结构设计.表结构.索引.查询语句. 2.show status查询数据库的性能参数 show stat ...

  9. 10个提升MySQL性能的小技巧

    从工作量分析到索引的三条规则,这些专家见解肯定会让您的MySQL服务器尖叫. 在所有的关系数据库中,MySQL已经被证明了完全是一头野兽,只要通知停止运行就绝对不会让你多等一秒钟,使你的应用置于困境之 ...

随机推荐

  1. 《机器学习实战(基于scikit-learn和TensorFlow)》第三章内容的学习心得

    本章主要讲关于分类的一些机器学习知识点.我会按照以下关键点来总结自己的学习心得:(本文源码在文末,请自行获取) 什么是MNIST数据集 二分类 二分类的性能评估与权衡 从二元分类到多类别分类 错误分析 ...

  2. 第六篇: 分布式配置中心(Spring Cloud Config)

    一.简介 在分布式系统中,由于服务数量巨多,为了方便服务配置文件统一管理,实时更新,所以需要分布式配置中心组件. 在Spring Cloud中,有分布式配置中心组件spring cloud confi ...

  3. 从github clone文件: Failed to receive SOCKS4 connect request ack.

    安装了代理,能上网,也能从github上下载文件,就是无法从github上clone文件, 查了很久资料后,终于发现使用sudo可以解决问题.不过,不知道原因是什么? 比如:git clone htt ...

  4. python中的变量和算数运算

    先说下变量的作用: 用来保存数据,为什么要保存? 后面要使用. 变量的概念: 变量就是用来存储一些信息,供程序以后调用或者操作修改.变量为标记数据提供了一种描述性的名字,以便我们的程序可以被程序的阅读 ...

  5. vue 去哪网项目 学习笔记(一)

    启动项 mian.js 是整个项目的入口程序 定义局部组建 components 是定义的局部组建 template 渲染app里的内容 单文件组建 单文件组建是以vue 结尾的内容 app组建的内容 ...

  6. Windows10开发手记-Windows App Certification Kit使用教程

    最近有同学通过MVP的渠道询问我Windows 10应用提交审核前是否有工具能够像win7一样做App兼容性测试,其实Windows SDK已经继承了一套优秀的App测试认证工具,这可以帮助我们快速通 ...

  7. python语法基础-初始化/继承

    写了一些程序,基本上都是直接def函数 然后在main方法中 调用 但是在一些应用程序中 会有基本语法的使用(初始化,继承) 初始化: 1.在程序执行时一定执行一次的操作 2.python中初始化in ...

  8. 链表的创建(C语言实现)

    学习链表之前,我们要知道为什么要引入链表. C语言中的数组使用之前,我们必须要定义数组的大小.但是当我们不知道数据个数(或者很大)时,定义数组大小就成了一个困扰,而且对于这么多数据的处理也会很麻烦.所 ...

  9. 常用的 git 命令清单

    (来自阮一峰的网络日志,看别人对git命令掌握的如此熟练,羡慕,但每次又记不得,无奈.供自己学习) git工作区,暂存区,版本库之间的关系: 我们建立的项目文件夹就是工作区,在初始化git(git i ...

  10. 通过清华大学镜像下载Android源码并编译源码

    之前看源码都是在Windows下用SourceInsight看,虽然达到了研究源码的效果,但终究还是有遗憾...趁着周末,准备在Ubuntu虚拟机上下载编译源码. 之前下源码时,有了解一些Androi ...