MySQL 已有大数据量表进行分区踩坑

一、背景
mysql 表中已有 4 亿数据，为提高查询效率，需创建分区，一开始计划是创建 HASH 分区，结果报错：
ERROR 1659 (HY000): Field 'partno' is of a not allowed type for this type of partitioning
1

查询得知报错原因，HASH 分区只支持数字分区，而我要分区的字段是 varchar 类型，故改用 KEY 分区
二、解决

KEY 分区语句：

alter table TABLENAME PARTITION BY key(COLUMN) PARTITIONS NUM;
1
TABLENAME ：表名
COLUMN：列名
NUM：分区数量

检查分区是否创建成功

EXPLAIN PARTITIONS SELECT * FROM `cars`
1
若成功，结果如下：

踩坑

拿小表测试 100 个分区发现，分区不均匀，一半分区有数据，一半没有数据，网上查询得知：key 分区，只有指定分区数目为质数，才能保证每个分区都有数据。
小表测试分区 97 个，分布均匀。

KEY 分区和 HASH 分区的区别

KEY 分区和 HASH 分区相似，但是 KEY 分区支持除 text 和 BLOB 之外的所有数据类型的分区，而 HASH 分区只支持数字分区，KEY 分区不允许使用用户自定义的表达式进行分区，KEY 分区使用系统提供的 HASH 函数进行分区。
当表中存在主键或者唯一键时，如果创建 key 分区时没有指定字段系统默认会首选主键列作为分区字列，如果不存在主键列会选择非空唯一键列作为分区列，注意唯一列作为分区列唯一列不能为null。

查看已分区表的详情

SELECT *
FROM INFORMATION_SCHEMA.PARTITIONS
WHERE TABLE_NAME = 'TABLE_NAME';
123

参考文章：
https://blog.csdn.net/echo_hello_world/article/details/80693224
https://bbs.csdn.net/topics/390857704
https://blog.csdn.net/jhq0113/article/details/44593511
原文链接：https://blog.csdn.net/weixin_41287692/article/details/83652085

MySQL 已有大数据量表进行分区踩坑的更多相关文章

oracle 大表已有大数据量建索引防卡 nologging
create index idx_th_user_info_fans_name on th_user_info(fans_name) nologging;
mysql数据库为什么要分表和分区？
一般下载的源码都带了MySQL数据库的,做个真正意义上的网站没数据库肯定不行. 数据库主要存放用户信息(注册用户名密码,分组,等级等),配置信息(管理权限配置,模板配置等),内容链接(html ,图片 ...
vue 在有大数据量的 table 中使用弹窗 input 输入数据时卡顿解决方案
vue 在有大数据量的 table 中使用弹窗 input 输入数据时卡顿解决方案原因:vue在进行输入时,进行了多次的render刷新渲染操作,导致了input框输入时发生的卡顿现象解决方法:在 ...
SQL 已有数据的表创建标识列
针对已有数据的表创建标识列: ,) constraint FID_1 primary key(FID)
mysql处理大数据量的查询速度究竟有多快和能优化到什么程度
mysql处理大数据量的查询速度究竟有多快和能优化到什么程度深圳-ftx(1433725026) 18:10:49 mysql有没有排名函数啊横瓜(601069289) 18:13:06 无 ...
mysql的大数据量的查询
mysql的大数据量查询分页应该用where 条件进行分页,limit 100000,100,mysql先查询100100数据量,查询完以后,将这些100000数据量屏蔽去掉,用100的量,但是如果 ...
一次flume exec source采集日志到kafka因为单条日志数据非常大同步失败的踩坑带来的思考
本次遇到的问题描述,日志采集同步时,当单条日志(日志文件中一行日志)超过2M大小,数据无法采集同步到kafka,分析后,共踩到如下几个坑.1.flume采集时,通过shell+EXEC(tail -F ...
MySQL单表数据量过千万，采坑优化记录，完美解决方案
问题概述使用阿里云rds for MySQL数据库(就是MySQL5.6版本),有个用户上网记录表6个月的数据量近2000万,保留最近一年的数据量达到4000万,查询速度极慢,日常卡死.严重影响业务 ...
Django使用Mysql已存在数据表的方法
在mysql数据库中已经存在有数据的表,自己又不想删除,下面方法可以同步django中创建的表 1.最好将自己建的表名改为前缀和django自动创建表名前缀相同,不改也可以,但是后期表太多容易混乱 2 ...

随机推荐

football Alternative form of foteball
football. Alternative form of foteball foteball(Late Middle English) football (game played with a ba ...
Django开发简单博客流程
什么是Django? Django是一个基于python的高级web开发框架它能够让开发人员进行高效且快速的开发高度集成(不用自己造轮子), 免费并且开源当前路径创建工程 django-admi ...
Elasticsearch7.3使用内置的JDK12
汇总:采用最简单的办法,就是在elasticsearch文件开头添加上这一行export JAVA_HOME=/home/vdb1/elastic_cluster/elasticsearch-7.3. ...
java之aop
1.AOP:aspect orientied programming 面向切面编程.就是横向编程. 2.面向切面编程是在不改变原有代码的情况下增加新的功能. 3.在spring中面向切面编程有两种应用 ...
P1347 排序 (拓扑排序,tarjan)
题目 P1347 排序解析打开一看拓扑排序,要判环. 三种情况有环(存在矛盾) 没环但在拓扑排序时存在有两个及以上的点入度为0(关系无法确定) 除了上两种情况(关系可确定) 本来懒了一下,直接在 ...
Assignment 2: UDP Pinger[课后作业]
Computer Networking : A Top-Down Approach 的课后作业. 要求: 基于UDP协议,实现一个Pinger工具. 服务端代码已经提供了,自己实现客户端的代码. 完整 ...
AngularJS $http用法总结
最近由于项目需要,在研究AngularJS $http的用法,查了很多资料,发现貌似没有一篇内容可以完整的满足我对$http的基本了解,为了下次方便自己查找,所以特意把最近查到的一些资料和自己的理解记 ...
Appscan漏洞之会话标识未更新
本次针对 Appscan漏洞会话标识未更新进行总结,如下: 1. 会话标识未更新 1.1.攻击原理在认证用户或者以其他方式建立新用户会话时,如果不使任何现有会话标识失效,攻击者就有机会窃取已认证 ...
iOS多线程GCD简介（二）
在上一篇中,我们主要讲了Dispatch Queue相关的内容.这篇主要讲一下一些和实际相关的使用实例,Dispatch Groups和Dispatch Semaphore. dispatch_aft ...
C# 里面将字符作为代码计算，主要是运算符号的计算
DataTable dt = new DataTable(); string str="1+2*(5+3)+3-1"; dt.Compute(str, "false&qu ...

MySQL 已有大数据量表进行分区踩坑

MySQL 已有大数据量表进行分区踩坑的更多相关文章

随机推荐

热门专题