一文总结高并发大数据量下MySQL开发规范【军规】

在互联网公司中，MySQL是使用最多的数据库，那么在并发量大、数据量大的互联网业务中，如果高效的使用MySQL才能保证服务的稳定呢？根据本人多年运维管理经验的总结，梳理了一些核心的开发规范，希望能给大家带来一些帮助。

一、基础规范

数据库字符集默认使用utf8mb4，兼容utf8，并支持存储emoji表情等四字节内容
禁止在线上生产环境做数据库压力测试
禁止从测试、开发环境、本机直连线上生产数据库
禁止在数据库中存储明文密码
禁止在数据库中存储图片、文件等大数据
禁止将业务日志实时保存到数据库，建议保存到日志文件，对于统计后的结果再存放到mysql中
禁止线上核心业务使用mysql存储过程、视图、触发器、Event、InnoDB外键约束等，这些容易将业务逻辑和db耦合在一起，而且在MySQL的这些特性中存在严重BUG
业务部门的推广活动，请提前通知dba进行服务和访问评估。

二、库表设计

库名、表名、字段名必须使小写字母，并采用下划线分割；对相关功能的表应当使用相同前缀，如job_xxx，前缀通常为库名或依赖主实体对象：数据库名称约定：db_xxx

数据库表默认存储引擎为InnoDB，所有环境禁止使用MyISAM、Memory等其他存储引擎
所有的表及字段都必须有备注，详细说明表及字段的含义
涉及货币金额或其他精度敏感的数据必须使用定点数DECIMAL替代FLOAT和DOUBLE
库名、表名、字段名禁止使用MySQL保留字，如date、like、desc、return等
控制表字段数，单表不超过50个纯INT/20个VARCHAR(10)字段等同存储体积的字段数，上限控制在20~50
字段长度只分配真正需要的空间

问题：使用VARCHAR(5) 和VARCHAR(200) 存储’hello’的磁盘空间开销是一样的,使用更短的列有什么优势吗？

更大的定义列会消耗更多的内存，因为MySQL通常会分配固定大小的内存块来保存内部值,尤其是使用内存临时表进行排序或操作时会特别糟糕

三、索引设计

基本规则：索引不是越多越好，能不添加的索引尽量不要添加，过多的索引会严重降低数据插入和更新的效率，并带来更多的读写冲突和死锁！

索引名称必须使用小写，普通索引按照“idx_字段名_字段名[_字段名]”进行命名，唯一索引按照“uniq_字段名_字段名[_字段名]”进行命名”
表必须有主键，推荐使用独立于业务的AUTO_INCREMENT列或全局ID生成器做主键，禁止使用多字段做联合主键
不使用UUID/MD5/HASH等函数生成的无规则值做主键，效率极差
索引数量控制

单张表中索引数量不超过5个
单个索引中的字段数不超过5个
对字符串使用前缀索引，前缀索引长度不超过10个字符

索引字段的顺序需要考虑每个字段去重之后的数量，区分度最大的【个数最多的】放在前面。
合理创建联合索引（避免冗余），符合最左前缀原则：(a,b,c) 相当于 (a) 、(a,b) 、(a,b,c)
可能需要添加索引的字段：

ORDER BY，GROUP BY，DISTINCT的字段需要添加在索引的后面
UPDATE、DELETE语句需要根据WHERE条件添加索引
对于JOIN操作，需要在JOIN字段上建立索引

线上慎用FORCE INDEX，使用前需要和DBA沟通，并得到DBA的测试允许
线上OLTP系统中禁止使用外键，高并发时极易引起死锁等问题
索引使用禁忌

不使用%前导的查询，如like “%ab”
不使用负向查询，如not in/not like/<>
不在低区分度的列上建立索引，例如“性别”
不在索引列进行数学运算和函数运算

示例：假设在表tab中id建立了索引

Select col_A,col_B from tab where id + 1 > 10001 不会使用索引
Select col_A,col_B from tab where id > 10001 – 1 会使用索引

四、SQL优化

线上尽量少使用大SQL，可能一条大SQL就把整个数据库堵死，将复杂SQL拆分为多条简单SQL，化繁为简

一条SQL只能在一个CPU上运算，如果SQL比较复杂执行效率会非常低【8.0之后开始支持单SQL多CPU核执行，但是效果有限】
简单SQL缓存命中率更高
减少锁表时间
充分利用多核CPU，提高并发效率

减少MySQL端的数学运算和逻辑判断，避免SQL语句出现md5()、order by rand()等
尽量少用SELECT * ,只取需要的数据列, 避免无谓的IO、CPU和网络开销
WHERE条件中，同一字段改写OR为IN()，IN包含的值不应过多，默认不超过200个，IN里禁止使用子查询
过滤表记录合并且不去重的情况，改写UNION为UNION ALL
减少使用拼接SQL,使用预编译语句，降低SQL注入概率
WHERE条件中的非等值条件（IN、BETWEEN、<、<=、>、>=）会导致使用不了联合索引的后续字段，注意避免
WHERE条件比较，字段类型和传入值必须保证类型一致，避免隐式转换

示例：

字段： code varchar(50) NOT NULL COMENT ‘编码’ #code上建立了索引

SELECT id,name,addr from tab_name where code=10001; 不会使用索引

SELECT id,name,addr from tab_name where code='10001'; 会使用索引

Limit分页优化

传统分页：

Select * from table limit 10000,10；

LIMIT原理：

Limit 10000,10 偏移量越大则越慢

推荐分页：

分页方式一：

Select * from table WHERE id>=23423 limit 11; #10+1 (每页10条)

Select * from table WHERE id>=23434 limit 11;

分页方式二：

Select * from table WHERE id >= ( select id from table limit 10000,1 ) limit 10;

分页方式三：

Select * from table INNER JOIN (SELECT id from table limit 10000,10) USING(id)

分页方式四：

程序取ID: Select id from table limit 10000,10;
Select * from table WHERE ID in(123,456…);

最后说明：

上述规范是多年MySQL数据库使用的经验总结，希望能给大家带来一些启发和帮助！

如果你还想看更多优质原创文章，欢迎关注我的公众号「数据库架构师」，提升数据库技能。

一文总结高并发大数据量下MySQL开发规范【军规】的更多相关文章

【Itext】解决Itext5大并发大数据量下输出PDF发生内存溢出outofmemery异常
尼玛,这个问题干扰了我两个星期!! 关键字 itext5 outofmemery 内存溢出大数据高并发多线程 pdf 导出报表 itext 并发在读<<iText in Acti ...
大数据量下MySQL插入方法的性能比较
不管是日常业务数据处理中,还是数据库的导入导出,都可能遇到需要处理大量数据的插入.插入的方式和数据库引擎都会对插入速度造成影响,这篇文章旨在从理论和实践上对各种方法进行分析和比较,方便以后应用中插入方 ...
php和node高并发大数据量怎么处理
有的时候可能因为疏忽忘记注册Service直接就使用了,使用那个Service时会报异常.这种情况项目都是可以编译通过的,是一个不太容易发现的BUG,如果那个Service在测试时没有覆盖到这个BUG ...
c#中@标志的作用 C#通过序列化实现深表复制细说并发编程-TPL 大数据量下DataTable To List效率对比【转载】C#工具类：实现文件操作File的工具类异步多线程 Async .net 多线程 Thread ThreadPool Task .Net 反射学习
c#中@标志的作用参考微软官方文档-特殊字符@,地址 https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/toke ...
大数据量时Mysql的优化
(转自网络) 如今随着互联网的发展,数据的量级也是撑指数的增长,从GB到TB到PB.对数据的各种操作也是愈加的困难,传统的关系性数据库已经无法满足快速查询与插入数据的需求.这个时候NoSQL的出现暂时 ...
mysql大数据量下的分页
mysql大数据量使用limit分页,随着页码的增大,查询效率越低下. 测试实验 1. 直接用limit start, count分页语句, 也是我程序中用的方法: select * from p ...
大数据量下的SQL Server数据库自身优化
原文: http://www.d1net.com/bigdata/news/284983.html 1.1:增加次数据文件从SQL SERVER 2005开始,数据库不默认生成NDF数据文件,一般情 ...
大数据量下，分页的解决办法，bubuko.com分享，快乐人生
大数据量,比如10万以上的数据,数据库在5G以上,单表5G以上等.大数据分页时需要考虑的问题更多. 比如信息表,单表数据100W以上. 分页如果在1秒以上,在页面上的体验将是很糟糕的. 优化思路: 1 ...
mysql百万级别重排主键id（网上的删除重建id在大数据量下会出错）
网上教程: 先删除旧的主键再新建主键 :数据量少时没问题,不会出现主键自增空缺间隔的情况(如:1,2,3,5):但是大数据量时会出现如上所述问题(可能是内部mysql多进程或多线程同时操作引起问题) ...

随机推荐

NC14662 小咪买东西
NC14662 小咪买东西题目题目描述小咪是一个土豪手办狂魔,这次他去了一家店,发现了好多好多( \(n\) 个)手办,但他是一个很怪的人,每次只想买 \(k\) 个手办,而且他要让他花的每一分 ...
NC201605 Bits
NC201605 Bits 题目题目描述 Nancy喜欢做游戏! 汉诺塔是一个神奇的游戏,神奇在哪里呢? 给出 \(3\) 根柱子,最开始时 \(n\) 个盘子按照大小被置于最左的柱子. 如果盘子数 ...
平衡树——splay 三
前文链接: 平衡树--splay 一 - yi_fan0305 - 博客园 (cnblogs.com) 平衡树--splay 二 - yi_fan0305 - 博客园 (cnblogs.com) 再补 ...
教你PC端网易云音乐自定义代理，VIP免费听歌！
今天分享一份福利吧,使用网易云音乐自定义代理实现免费听和下载VIP.极高音质.付费的歌曲,这里主要针对PC端电脑版的,需要自己写脚本运行. 01 安装node.js Node.js是一个让 JavaS ...
记一次删除k8s namespace无法删除的问题
在用longhorn工具做k8s存储卷动态预配的时候,需要修改longhorn.yaml的一个默认参数,修改完成需要重新加载longhorn.yaml,结果重新加载出错了,修改的参数没有生效,于是执行 ...
CSS 导航栏底线向两边延伸动画
利用元素向左移动的同时,宽度变长,实现两边延伸效果. react代码: <ul className="tab"> { moduleList.map((item: any ...
[极客大挑战 2019]BabySQL-1|SQL注入
1.打开题目之后,查看源代码信息,发现check.php文件,结果如下: 2.那就只能尝试登录,经测试当输入or.by.select.from.and.where等关键字时会被过滤且会被过滤为空(过滤 ...
MySQL建表DDL规范(欢迎补充)
MySQL建表DDL规范(欢迎补充) 基本规范: 表名和字段名全大写,一般表名以T开头脚本需支持可重复执行,带IF NOT EXISTS ,但不可带DROP语句字符集使用utf8mb4 (CHAR ...
珠联壁合地设天造|M1 Mac os(Apple Silicon)基于vscode(arm64)配置搭建Java开发环境(集成web框架Springboot)
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_194 也许有人从未听说过Python,但是不会有人没听说过Java,它作为一个拥有悠久历史的老牌编程语言,常年雄踞TIOBE编程语 ...
分布式二级缓存组件实战（Redis+Caffeine实现）
前言在生产中已有实践,本组件仅做个人学习交流分享使用.github:https://github.com/axinSoochow/redis-caffeine-cache-starter 个人水平有 ...

一文总结高并发大数据量下MySQL开发规范【军规】

一文总结高并发大数据量下MySQL开发规范【军规】的更多相关文章

随机推荐

热门专题