MySQL分库分表的原则

一、分表

　　当一个表的数据达到几千万条的时候，每一次查询都会花费更长的时间，如果这时候在使用链表查询，那么我想应该会实在那里，那么我们应该如何解决这个问题呢？

　　1、为什么要分表：

　　　　分表的目的就是为了解决当数据量太大的时候，数据查询变慢的问题，那么我们应该如何去解决这个问题呢？这时候就用到了分表。

　　　　那么什么是分表呢？
　　　　a.根据业务逻辑进行纵向拆分（按照数据库字段的必要性进行拆分）

　　　　b.根据数据库数据量级进行拆分，一般拆分是在几百万这个量级上，因为超过千万条数据库查询就会明显变慢，具体如何拆分可以根据自己数据库服务器的实际情况进行测试和分析后决定。

　　2、分表的逻辑是什么？

　　　　分表方法一：预先估计出要频繁插入的表，这样的表之后大概率会是一个数据量非常大的表，那么我们就可以预先分出n个表来存储数据，存储数据时可以根据一定的规则判断存储到那张表，读取时也是使用相同的规则进行判断。如可以使取模的方式，也可使用hash的方式进行判断。

　　取模方式：
function hash_table($table_name, $user_id, $total){

return $table_name . '_' . (($user_id % $total) + );

} 　　hash方式：　

　　　　function get_hash_table($table,$userid) {

　　　　　　$str = crc32($userid);

　　　　　　 if($str<0){

　　　　　　　　$hash = "0".substr(abs($str), 0, 1);

　　　　　　}else{

　　　　　　　　$hash = substr($str, 0, 2);

　　　　　　}

　　　　　　return $table."_".$hash;

　　　　}

　　　　查询数据也可以使用上面的逻辑，先判断出要查询的数据位于哪些表中，然后在进行查询

　　　　该方法一旦形成表数据，那么想要改变规则非常困难，那将是一个梦魇，所以扩展性极差

　　　　分表方法二：利用merge存储引擎来实现分表
　　　　　　merge引擎是就是一组MyISAM表的组合，类似于视图，merge表本身不存储任何数据，你对merge表的操作，实际上是对其字表的操作，但是这个对于程序来说是透明的，在插入的时候默认插入到第一张或最后一张的字表中，这个可以通过merge创建时进行设置。如果子表是预先建立的那么你也可以选择在插入的时候按照一定的规则，这几对子表进行插入。

　　　　实例：
　　　　　　分表1：

CREATE TABLE `AuthTrace1` (
`Id` int(11) NOT NULL AUTO_INCREMENT,
`AuthId` char(255) DEFAULT NULL,
`Addtime` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '添加记录的当前时间',
`UserIp` varchar(255) DEFAULT NULL COMMENT '用户Ip',
`Date` date DEFAULT NULL COMMENT 'yyyyMMdd格式',
`ExtraInfo` varchar(255) DEFAULT NULL COMMENT '额外信息',
`UserMAC` varchar(255) DEFAULT NULL COMMENT 'mac地址',
PRIMARY KEY (`Id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

　　　　　　分表2：

　　　　Merge表：

      CREATE TABLE `AuthTrace_Merge` (

          `Id` int(11) NOT NULL AUTO_INCREMENT,

          `AuthId` char(255) DEFAULT NULL,

          `Addtime` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '添加记录的当前时间',

          `UserIp` varchar(255) DEFAULT NULL COMMENT '用户Ip',

          `Date` date DEFAULT NULL COMMENT 'yyyyMMdd格式',

          `ExtraInfo` varchar(255) DEFAULT NULL COMMENT '额外信息',

          `UserMAC` varchar(255) DEFAULT NULL COMMENT 'mac地址',

          PRIMARY KEY (`Id`)

      )ENGINE=MERGE DEFAULT CHARSET=utf8 INSERT_METHOD=LAST AUTO_INCREMENT=1 UNION=(`AuthTrace1`,`AuthTrace2`);

INSERT_METHOD：表示插入方式；

INSERT_METHOD=LAST 添加数据的时候插入到最后一个表，这里就是t2

INSERT_METHOD=FIRST 添加数据的时候插入到第一个表，这里就是t1

INSERT_METHOD=0 不允许插入

UNION = (`AuthTrace1`,`AuthTrace2`) 关联AuthTrace1和AuthTrace2表

Merge表数据结构必须和分表完全一致

　　 merge存在的问题：数据插入式无法保证数据id的不重复

当然分表还有其他方式很多种方式和逻辑，我在这里做个抛砖引玉，大家有什么别的方法可以留言

MySQL分库分表的原则的更多相关文章

Mysql分库分表方案
Mysql分库分表方案 1.为什么要分表: 当一张表的数据达到几千万时,你查询一次所花的时间会变多,如果有联合查询的话,我想有可能会死在那儿了.分表的目的就在于此,减小数据库的负担,缩短查询时间. m ...
MYSQL分库分表和不停机更改表结构
在MYSQL分库分表中我们一般是基于数据量比较大的时间对mysql数据库一种优化的做法,下面我简单的介绍一下mysql分表与分库的简单做法. .分库分表很明显,一个主表(也就是很重要的表,例如用户表 ...
MySQL分库分表备份脚本
MySQL分库备份脚本 #脚本详细内容 [root@db02 scripts]# cat /server/scripts/Store_backup.sh #!/bin/sh MYUSER=root M ...
【分库、分表】MySQL分库分表方案
一.Mysql分库分表方案 1.为什么要分表: 当一张表的数据达到几千万时,你查询一次所花的时间会变多,如果有联合查询的话,我想有可能会死在那儿了.分表的目的就在于此,减小数据库的负担,缩短查询时间. ...
Java互联网架构-Mysql分库分表订单生成系统实战分析
概述分库分表的必要性首先我们来了解一下为什么要做分库分表.在我们的业务(web应用)中,关系型数据库本身比较容易成为系统性能瓶颈,单机存储容量.连接数.处理能力等都很有限,数据库本身的“有状态性” ...
高可用Mysql架构_Mysql主从复制、Mysql双主热备、Mysql双主双从、Mysql读写分离（Mycat中间件）、Mysql分库分表架构（Mycat中间件）的演变
[Mysql主从复制]解决的问题数据分布:比如一共150台机器,分别往电信.网通.移动各放50台,这样无论在哪个网络访问都很快.其次按照地域,比如国内国外,北方南方,这样地域性访问解决了.负载均衡:M ...
mysql分库分表(二)
mysql分库分表参考: https://www.cnblogs.com/dongruiha/p/6727783.html https://www.cnblogs.com/oldUncle/p/64 ...
mysql分库分表(一)
mysql分库分表参考: https://blog.csdn.net/xlgen157387/article/details/53976153 https://blog.csdn.net/cleve ...
(转)企业Shell实战-MySQL分库分表备份脚本
本文来自http://www.xuliangwei.com/xubusi/252.html 免费视频讲解见 http://edu.51cto.com/course/course_id-5064.htm ...

随机推荐

ubuntu18.04安装部署typecho个人博客
LNMP一键安装包安装 wget http://soft.vpser.net/lnmp/lnmp1.5.tar.gz -cO lnmp1.5.tar.gz && tar zxf lnm ...
【大厂面试07期】说一说你对synchronized锁的理解？
synchronized锁的原理也是大厂面试中经常会涉及的问题,本文主要通过对以下问题进行分析讲解,来帮助大家理解synchronized锁的原理. 1.synchronized锁是什么?锁的对象是什 ...
<WP8开发学习笔记>修改panorama全景控件的标题的大小
panorama(全景)控件非常具有WinPhone特色,但是那个巨大的标题许多时候会让人觉得违和.怎么修改它呢? 最开始想到的是加一个FontSize,结果毫无影响.╮(╯-╰)╭ <phon ...
Tournament Chart【模拟+vector+map+string】
Tournament Chart 传送门:链接来源:UPC10889 题目描述 In 21XX, an annual programming contest, Japan Algorithmist ...
TensorFlow从0到1之TensorFlow实现反向传播算法（21）
反向传播(BPN)算法是神经网络中研究最多.使用最多的算法之一,它用于将输出层中的误差传播到隐藏层的神经元,然后用于更新权重. 学习 BPN 算法可以分成以下两个过程: 正向传播:输入被馈送到网络,信 ...
Arduino_DH11+0.96OLED_u8glib库温湿度显示
u8glib_arduino_OLED0.96一.电路连接 DHT11接线方式:GND<————>GNDDATA<————>2(数字输入/输出)VCC<————>5 ...
深入理解 nth-child 和 nth-of-type 的区别
ele:nth-of-type(n) 为什么叫 of-type ,就是说它是以“type”来区分的,也就是说ele:nth-of-type(n)指的是父元素下第n个ele元素. ele:nth-ch ...
SpringCloud（一）版本选择
Springboot版本官网:https://spring.io/projects/spring-boot 在官网上 springboot已经更新到最新2.2.6 Spingcloud版本官网:h ...
11.DRF-权限
Django rest framework源码分析(2)----权限添加权限 (1)API/utils文件夹下新建premission.py文件,代码如下: message是当没有权限时,提示的信息 ...
ElasticSearch--validate验证搜索语句是否合法或者存在语法错误
GET /accounts/person/_validate/query?explain { "query":{ "match": { "user&q ...

MySQL分库分表的原则

MySQL分库分表的原则的更多相关文章

随机推荐

热门专题