msyql分区与分库分表
分区
工作原理
对用户而言,分区表是一个独立的逻辑表,但是底层MySQL将其分成多个物理子表,这对用户来说是透明的,每一个分区表都会使用一个独立的表文件。
如果数据量比较大,可以进行分区。分区对PHP层面是无感知的,对代码没有改变。但是需要对mysql的表来做一个物理层面的拆分。将数据通过一些策略进行拆分,客户也是无感知的,对业务逻辑也没有什么影响。
创建表时使用partition by 子句定义每个分区存放的数据,比如年龄,地区等等。执行查询时,优化器会根据分区定义过滤那些没有我们需要数据的分区,这样查询只需要查询所需数据存在的分区即可。
目的
将数据按照一个较粗的力度分在不同的表中,这样可以将相关的数据存放在一起。而且如果想一次性删除整个分区的数据也很方便。
使用场景
表非常大或者只在表的最后有热点数据,其它都是历史数据。可以分区
分区表的数据更容易维护,可以对独立的分区进行独立的操作,就相当于独立的表,不过用户感知不到
分区表的数据可以分布在不同的机器上,从而高效利用资源。
可以使用分区表来避免某些特殊的瓶颈。比如数据库的特殊查询等等。
可以备份和恢复独立的分区。
限制
一个表最多只能有1024个分区
最好用mysql5.5以上的,可以使用列分区。否则mysql中含有null会使分区过滤无效。
分区字段中如果有主键 和唯一索引列,那么主键列和唯一列都必须包含进来。
分区表中不能有外键索引
分区需要对现有表的结构进行修改
所有分区必须使用相同的存储引擎
选择分区的成本可能很高,因为服务器需要扫描所有分区定义的列表来找到匹配的值,分区越多,成本越高。哈希分区和键分区没有这样的问题。
分区函数中可以使用的函数和引擎也有一些限制。某些引擎不支持分区,如MERGE存储引擎 。
对于MyISAM的分区表,不能使用load index into cache ,因为不能把索引再缓存到内存当中
对于MyISAM 表,使用分区表时需要打开更多的文件描述符,相对来说会降低查询的效率
分表
工作原理
通过一些hash算法或者工具实现将一张数据表垂直或者水平进行物理切分。
使用场景
单表记录条数达到百万甚至千万级别
解决表锁的问题
分表方式
水平分割:
表很大,分割后可以降低查询时需要读的数据和索引的页数 ,同时也降低了索引的层数,提高了查询的速度。行变列不变
使用场景:
表中的数据本身就有独立性,例如表中分别记录各个地区的数据,有些数据活跃,有些不活跃
需要把数据存放在多个介质上,比如说把最新的数据放在缓存里边,或者放在不同服务器里利用服务器的资源
缺点
给应用增加复杂度,查询时需要查询多个表名,查询所有数据需要union操作
在许多数据库应用中,这种复杂度会超过它所带来的优点,查询时会增加一个索引层的的磁盘次数
垂直分表
把主键和一些列放在一个表,然后把主键和另外的列放在另一个表中。列变行不变
适用场景
某些列常用,某些列不常用
可以使数据行变小,一个数据页能存储更多数据,查询时减少i/o次数,对于i/o来说有一定优化
缺点
会有冗余列,查询所有数据时需要join操作
分库分表的缺点
有些分表的策略基于应用层的逻辑算法,一旦逻辑算法改变,那么整个分表逻辑就会改变,扩展性较差
对于应用层来说,逻辑算法会增加开发成本
msyql分区与分库分表的更多相关文章
- 基于Mysql数据库亿级数据下的分库分表方案
移动互联网时代,海量的用户数据每天都在产生,基于用户使用数据的用户行为分析等这样的分析,都需要依靠数据都统计和分析,当数据量小时,问题没有暴露出来,数据库方面的优化显得不太重要,一旦数据量越来越大时, ...
- 分库分表技术演进&最佳实践
每个优秀的程序员和架构师都应该掌握分库分表,这是我的观点. 移动互联网时代,海量的用户每天产生海量的数量,比如: 用户表 订单表 交易流水表 以支付宝用户为例,8亿:微信用户更是10亿.订单表更夸张, ...
- Mysql分表和分区的区别、分库分表介绍与区别
分表和分区的区别: 一,什么是mysql分表,分区 什么是分表,从表面意思上看呢,就是把一张表分成N多个小表,具体请看:mysql分表的3种方法 什么是分区,分区呢就是把一张表的数据分成N多个区块,这 ...
- (转) MySQL分区与传统的分库分表
传统的分库分表 原文:http://blog.csdn.net/kobejayandy/article/details/54799579 传统的分库分表都是通过应用层逻辑实现的,对于数据库层面来说,都 ...
- Mysql分表和分区的区别、分库分表介绍与区别(转)
分表和分区的区别: 一,什么是mysql分表,分区 什么是分表,从表面意思上看呢,就是把一张表分成N多个小表,具体请看:mysql分表的3种方法 什么是分区,分区呢就是把一张表的数据分成N多个区块,这 ...
- 由mysql分区想到的分表分库的方案
在分区分库分表前一定要了解分区分库分表的动机. 对实时性要求比较高的场景,使用数据库的分区分表分库. 对实时性要求不高的场景,可以考虑使用索引库(es/solr)或者大数据hadoop平台来解决(如数 ...
- MySql分库分表与分区的区别和思考
一.分分合合 说过很多次,不要拘泥于某一个技术的一点,技术是相通的.重要的是编程思想,思想是最重要的.当数据量大的时候,需要具有分的思想去细化粒度.当数据量太碎片的时候,需要具有合的思想来粗化粒度. ...
- CRL快速开发框架系列教程十一(大数据分库分表解决方案)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
- 重磅来袭,使用CRL实现大数据分库分表方案
关于分库分表方案详细介绍 http://blog.csdn.net/bluishglc/article/details/7696085 这里就不作详细描述了 分库分表方案基本脱离不了这个结构,受制于实 ...
随机推荐
- 关于c++中的全局变量(不赋值的全局变量算定义)
定义有三种: 1.不赋值的定义:int a; 2.赋值的定义:int a=5; 或者 int a;a=5; 3.加extern的定义:extern int a=5;//其实和不加是一样的. 声明只有一 ...
- linux命令学习笔记(35):ln 命令
ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同步的链接.当我们需要在 不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都放一个必须相同的文件,我们只要 ...
- 【JVM】java棧
java棧和函数调用的关系图 [名词解释]--->java棧是一块线程的私有空间--->java的棧是先进后出的数据结构.函数返回,则该函数的棧帧被弹出.--->一个函数对应一个棧帧 ...
- 白话算法(6) 散列表(Hash Table) 从理论到实用(下)
[澈丹,我想要个钻戒.][小北,等等吧,等我再修行两年,你把我烧了,舍利子比钻戒值钱.] ——自扯自蛋 无论开发一个程序还是谈一场恋爱,都差不多要经历这么4个阶段: 1)从零开始.没有束缚的轻松感.似 ...
- BZOJ2809:[APIO2012]dispatching
浅谈左偏树:https://www.cnblogs.com/AKMer/p/10246635.html 题目传送门:https://lydsy.com/JudgeOnline/problem.php? ...
- bzoj 4816 数字表格 —— 反演
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4816 推导过程同:http://www.cnblogs.com/zhouzhendong/p ...
- 【转】 Pro Android学习笔记(六七):HTTP服务(1):HTTP GET
目录(?)[-] HTTP GET小例子 简单小例子 出现异常NetworkOnMainThreadException 通过StrictMode进行处理 URL带键值对 Andriod应用可利用ser ...
- 从生成文件对比两种创建虚拟机的方式:boot from image和boot from bootable-volume
1. 创建bootable-volume(参考:http://docs.openstack.org/grizzly/openstack-compute/admin/content/instance-c ...
- Elasticsearch之curl创建索引库
关于curl的介绍,请移步 Elasticsearch学习概念之curl 启动es,请移步 Elasticsearch的前后台运行与停止(tar包方式) Elasticsearch的前后台运行与停止( ...
- IPC编程之消息队列
本地的进程间通信(IPC)有很多种方式,但可以总结为下面3类: 1.消息传递(管道.FIFO.消息队列) 2.同步(互斥量.条件变量.读写锁.文件和写记录锁.信号量) 3.共享内存(匿名的和具名的) ...