mysql千万级数据优化查询

下课后我要去放牛 2024-10-10 19:56:11 原文

我们在做一个项目，一个网站或一个app时，用户量巨增，当使用的mysql数据库中的表数据达到千万级时，可以从以下方面考滤优化：

　　1、在设计数据库表的时候就要考虑到优化

　　2、查询sql语句上的优化

　　3、从数据库设计上进行结大框架的设计：如分区、分表、分库

1、在设计数据库表的时候就要考虑到优化

　　1、尽可能使用not null定义字段，避免null值字段出现，null值会占用额外的索引空间

　　2、使用固定长度的字段类型如char而不是varchar

　　3、添加索引，在查询频繁的字段上加索引，如在where，group by， order by，on中出现的字段加索引

　　4、字符字段只建立前缀索引，字符字段最好不要做主键

2、查询sql语句上的优化

　　1、不要使用select * 查询，将要查找的字段写出来

　　2、使用join来代替子查询

　　3、使用limit 对查询结果的记录进行限定，千万级别的数据太多，后面的数据没必要查出来

　　4、OR改写成IN：因为OR的效率是n级别，IN的效率是log(n)级别

　　5、少使用触发器和函数，可在应用程序代码实现

　　6、也尽量少用join

　　7、尽量避免在where子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描

　　8、列表数据不要拿全表的数据，要使用limit 来分页

　　来说说MySql的引擎：

　　　　目前广泛使用的是MyISAM和InnoDB两种引擎：

　　　　　　MyISAM引擎，MySQL5.1之前版本默认引擎，它的特点是：不支持行锁，不支持事务，不支持外键

　　　　　　InnoDB引擎，MySQL5.5后默认引擎，它的特点：支持行锁，采用MVCC来支持高并发，支持事务，支持外键，不支持全文索引

　　

　　分区：

　　　　　　分区我不太明白，没怎么看懂

　　分表：

　　　　分表就是把一张超多数据的表，分成多张表，把一次查询，分成多次查询，然后把结果组合返回给用户。

　　　　分表：又有两种方式，分为垂直拆分和水平拆分，通常以某个字段做拆分项，比如以id字段拆分为100张表：表名为tableName_id%100

　　　　分表只适合开发初期做好分表处理，不适合应用上线后再做修改，成本太高。

　　分库：

　　　　分库：就是把一个数据库分成多个，然后做读写分离。

　　有钱的话，使用其他方法，阿里云数据库POLARDB，阿里云OcenanBase （淘宝使用，扛得住双十一），阿里云HybridDB for MySQL (原PetaData) ，腾讯云数据库：腾讯云DCDB等等

另一种情况：数据量过亿

　　数据量过亿只能使用传说中的大数据了。（做了这么多年开发，从来没接触过这玩意，可能都没进什么大公司的原因吧）

　　hadoop家族，（具体怎么玩的暂时还不知道）

。。。

mysql千万级数据优化查询的更多相关文章

mysql千万级数据量查询出所有重复的记录
查询重复的字段需要创建索引,多个条件则创建组合索引,各个条件的索引都存在则不必须创建组合索引有些情况直接使用GROUP BY HAVING则能直接解决:但是有些情况下查询缓慢,则需要使用下面其他的方 ...
(转载)MYSQL千万级数据量的优化方法积累
转载自:http://blog.sina.com.cn/s/blog_85ead02a0101csci.html MYSQL千万级数据量的优化方法积累 1.分库分表很明显,一个主表(也就是很重要的表 ...
通用技术 mysql 亿级数据优化
通用技术 mysql 亿级数据优化一定要正确设计索引一定要避免SQL语句全表扫描,所以SQL一定要走索引(如:一切的 > < != 等等之类的写法都会导致全表扫描) 一定要避免 lim ...
DB-SQL-MySQL-杂项-调优：Mysql千万以上数据优化、SQL优化方法
ylbtech-DB-SQL-MySQL-杂项-调优:Mysql千万以上数据优化.SQL优化方法 1.返回顶部 1. 1,单库表别太多,一般保持在200以下为宜 2,尽量避免SQL中出现运算,例如se ...
MySQL 千万级数据量根据（索引）优化查询速度
一.索引的作用索引通俗来讲就相当于书的目录,当我们根据条件查询的时候,没有索引,便需要全表扫描,数据量少还可以,一旦数据量超过百万甚至千万,一条查询sql执行往往需要几十秒甚至更多,5秒以上就已经让 ...
mysql千万级数据量根据索引优化查询速度
(一)索引的作用索引通俗来讲就相当于书的目录,当我们根据条件查询的时候,没有索引,便需要全表扫描,数据量少还可以,一旦数据量超过百万甚至千万,一条查询sql执行往往需要几十秒甚至更多,5秒以上就已经 ...
MYSQL千万级数据量的优化方法积累
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
MySQL千万级数据分区存储及查询优化
作为传统的关系型数据库,MySQL因其体积小.速度快.总体拥有成本低受到中小企业的热捧,但是对于大数据量(百万级以上)的操作显得有些力不从心,这里我结合之前开发的一个web系统来介绍一下MySQL数据 ...
Mysql千万级数据删除实操-企业案例
某天,在生产环节中,发现一个定时任务表,由于每次服务区查询这个表就会造成慢查询,给mysql服务器带来不少压力,经过分析,该表中绝对部分数据是垃圾数据需要删除,约1050万行,由于缺乏处理大数据的额 ...

随机推荐

Java开发笔记（六十七）清单：ArrayList和LinkedList
前面介绍了集合与映射两类容器,它们的共同特点是每个元素都是唯一的,并且采用二叉树方式的类型还自带有序性.然而这两个特点也存在弊端:其一,为啥内部元素必须是唯一的呢?像手机店卖出了两部Mate20,虽然 ...
Java开发笔记（七十六）如何预防异常的产生
每个程序员都希望自己的程序稳定运行,不要隔三岔五出什么差错,可是程序运行时冒出来的各种异常着实烦人,令人不胜其扰.虽然可以在代码中补上try/catch语句捕捉异常,但毕竟属于事后的补救措施.与其后知 ...
数据结构（java版）学习笔记（一）——线性表
一.线性表的定义线性表是n(n>=0)个具有相同特性的数据元素的有限序列. 线性表是最简单.最常用的一种数据结构线性表属于线性结构的一种如果一个数据元素序列满足: (1)除第一个和最后一个 ...
Arcgis瓦片--数据获取
Arcgis的二维地图瓦片有两种获取方式 1.在Arcmap中对配置好的地图进行切图,生成对应瓦片 2.使用第三方的地图下载器,直接下载,导出成arcgis瓦片格式即可使用. 备注:这里主要介绍第二种 ...
自定义HorizontalScrollView的scrollBar
尊重劳动成果,转载请标明出处http://www.cnblogs.com/tangZH/p/8423803.html android滑动组件的scrollBar,看了不是很顺眼,没办法,因为项目需求, ...
Android使用Mob ShareSDK 分享不同平台
Share分享,要注意的是,如果不能调用起微信相关,看看微信开发者平台是否添加正式,微信开发者正式之后,打正式包进行分享调用 /*分享弹框*/ private void showShare2() { ...
当Flutter遇到节流与防抖
相信web前端的开发者都或多或少的遇到过节流与防抖的问题.函数节流和函数防抖,两者都是优化执行代码效率的一种手段.在一定时间内,代码执行的次数不一定是越多越好.相反,频繁的触发或者执行代码,会造成大量 ...
C#设置电脑时间帮助类
using System; using System.Collections.Generic; using System.Diagnostics; using System.Linq; using S ...
PHP如何实现在数据库随机获取几条记录
本文实例讲述了PHP实现在数据库百万条数据中随机获取20条记录的方法.PHP实例分享给大家供大家参考,具体如下: 为什么要写这个? 在去某个公司面试时,让写个算法出来,当时就蒙了,我开发过程中用到算法 ...
Visual Studio 2019 RC入门
介绍在本文中,让我们看看如何开始使用Visual Studio 2019 RC.Microsoft现已发布Visual Studio Release Candidate,现在可以下载了.最初,Mic ...