mysql海量数据优化

一般我们数据量大的时候，然后就需要进行分页，一般分页语句就是limit offset，rows。这种分页数据量小的时候是没啥影响的，一旦数据量越来越大随着offset的变大，性能就会越来越差。下面我们就来实验下：

准备数据
1. 建一个测试表引擎为MyISAM（插入数据没有事务提交，插入速度快）的表。

CREATE TABLE USER (

id INT ( 20 ) NOT NULL auto_increment,

NAME VARCHAR ( 20 ) NOT NULL,

address VARCHAR ( 20 ) NOT NULL,

PRIMARY KEY ( id )

) ENGINE = MyISAM;

写一个批量插入的存储过程

delimiter //

# 删除表数据

TRUNCATE TABLE t;

# 如果已经有sp_test_batch存储过程，将其删除，后面重新创建

DROP PROCEDURE IF EXISTS sp_test_batch;

# 创建存储过程，包含num和batch输入，num表示插入的总行数，batch表示每次插入的行数

CREATE PROCEDURE sp_test_batch(IN num INT,IN batch INT)

BEGIN

	SET @insert_value = '';

	# 已经插入的记录总行数

  SET @count = 0;

	#

	SET @batch_count = 0;

	WHILE @count < num DO

		# 内while循环用于拼接INSERT INTO t VALUES (),(),(),...语句中VALUES后面部分

		WHILE (@batch_count < batch AND @count < num) DO

			IF @batch_count>0

			THEN

				SET @insert_value = concat(@insert_value,',');

			END IF;

			SET @insert_value = concat(@insert_value,"('name", @count, "','address", @count, "')");

			SET @batch_count = @batch_count+1;

		END WHILE;

		SET @count = @count + @batch_count;

		# 拼接SQL语句并执行

		SET @exesql = concat("insert into user(name,address) values ", @insert_value);

		PREPARE stmt FROM @exesql;

		EXECUTE stmt;

		DEALLOCATE PREPARE stmt;

		# 重置变量值

		SET @insert_value = '';

		SET @batch_count=0;

	END WHILE;

	# 数据插入完成后，查看表中总记录数

	SELECT COUNT(id) FROM user;

END

CALL sp_test_batch(10000000,10000);

插入100w数据

测试性能下下面我们分别针对于offset等于不同的值来进行实：offset等于10000时耗时

offset等于100000时耗时

offset等于1000000时耗时

offset等于5000000时耗时

offset等于10000000时耗时

从上图可以得出随着offset的值越大耗时就越来越多。这还只是1000w数据，如果我们上亿数据呢，可想而知这时候查询的效率有多差。下面我们来进行优化。

4 .进行优化

子查询的分页方式：

SELECT * FROM user WHERE  id >=

(SELECT id FROM user  ORDER BY id LIMIT 9000000, 1) LIMIT 10

从图可以得出子查询确实速度快了一倍。

JOIN分页方式：

SELECT * FROM user t1 INNER join

(SELECT id FROM user  ORDER BY id LIMIT 9000000, 10) t2 on t2.id =t1.id

join的方式比子查询性能在稍微好点。

终极优化：

这个时间性能是最好的。这种优化必须要依赖前一次的查询的最大ID，如果是那种分页直接可以指定多少页的是不行的，必须是只能后一页，后一页这么点击。

SELECT id FROM user  where id > 9000000 ORDER BY id  LIMIT 10;

通过伪列对ID进行分页，可以多线程同时查询，这个适合分页把全量数据加载到缓存。

得到ID的范围



select id from(

SELECT @rownum:=@rownum+1 AS rownum, id FROM   user as t1 ,(SELECT @rownum:=0) t2 order

by t1.id asc

) t3 where t3.rownum%5000=0

select * from user where id >0 and id<=5000 一直到最大的id

mysql海量数据优化的更多相关文章

MySQL架构优化：定时计划任务与表分区
转自: MySQL架构优化实战系列3:定时计划任务与表分区 - 今日头条(TouTiao.com)http://toutiao.com/a6304736482361049345/?tt_from=mo ...
从运维角度来分析mysql数据库优化的一些关键点【转】
概述一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善. 1.数据库表设计项目立项后,开发部根据产品部需求开发项目,开发工程师工作其中一部分 ...
Mysql 性能优化教程
Mysql 性能优化教程目录目录 1 背景及目标 2 Mysql 执行优化 2 认识数据索引 2 为什么使用数据索引能提高效率 2 如何理解数据索引的结构 2 优化实战范例 3 认识影响结果集 4 ...
转 Mysql性能优化教程
Mysql性能优化教程背景及目标厦门游家公司(4399.com)用于员工培训和分享. 针对用户群为已经使用过mysql环境,并有一定开发经验的工程师针对高并发,海量数据的互联网环境. 本文语言为 ...
MySQL架构优化实战系列3：定时计划任务与表分区
原创 2016-07-08 汤抗 DBAplus社群一定时计划任务 1.概论 mysql计划任务可以定时更新数据库表或者做大文件的汇总表. 2.配置开启计划任务 SHOW VARIABL ...
MySQL数据库优化、设计与高级应用
MySQL数据库优化主要涉及两个方面,一方面是对SQL语句优化,另一方面是对数据库服务器和数据库配置的优化. 数据库优化 SQL语句优化为了更好的看到SQL语句执行效率的差异,建议创建几个结构复杂的 ...
Mysql - 性能优化之子查询
记得在做项目的时候, 听到过一句话, 尽量不要使用子查询, 那么这一篇就来看一下, 这句话是否是正确的. 那在这之前, 需要介绍一些概念性东西和mysql对语句的大致处理. 当Mysql Server ...
Mysql性能优化三（分表、增量备份、还原）
接上篇Mysql性能优化二对表进行水平划分如果一个表的记录数太多了,比如上千万条,而且需要经常检索,那么我们就有必要化整为零了.如果我拆成100个表,那么每个表只有10万条记录.当然这需要数据在逻 ...
Mysql性能优化一
下一篇:Mysql性能优化二 mysql的性能优化无法一蹴而就,必须一步一步慢慢来,从各个方面进行优化,最终性能就会有大的提升. Mysql数据库的优化技术对mysql优化是一个综合性的技术,主要包 ...

随机推荐

JZOJ 2020.10.6 【NOIP2017提高A组模拟9.7】陶陶摘苹果
陶陶摘苹果题目 Description Input Output Sample Input 10 5 110 3 100 200 150 140 129 134 167 198 200 111 0 ...
day2(RESTful风格API)
1.RESTful风格API 详情查看博客地址:https://www.cnblogs.com/xiaonq/p/10053234.html 1.1 什么是RESTful REST与技术无关,代表的 ...
PHP代码审计分段讲解（2）
03 多重加密源代码为: <?php include 'common.php'; $requset = array_merge($_GET, $_POST, $_SESSION, $_COOK ...
2、pytorch——Linear模型（最基础版，理解框架，背诵记忆）（调用nn.Modules模块）
#define y = X @ w import torch from torch import nn #第一模块,数据初始化 n = 100 X = torch.rand(n,2) true_w = ...
[亲测可用]BCompare文件比较对比工具4.3.4绿色版
程序员必备良品 Beyond Compare 灰常好用,一直使用的文本文件比较工具,用来对比两个文件文本的差异,可以用于各种代码,文本对比使用方法: 解开压缩后:添加右键的 !添加右键.bat,运 ...
Docker 命令自动补全？要的
前言不知道这个小伙伴有多久没用过 Docker 了, 突然对我说 Docker 命令怎么发生变化了 docker run ... #变成了 docker container run ... 他说,本 ...
最简 Spring IOC 容器源码分析
前言 BeanDefinition BeanFactory 简介 Web 容器启动过程 bean 的加载 FactoryBean 循环依赖 bean 生命周期公众号前言许多文章都是分析的 xml ...
基于Fisco-Bcos的区块链智能合约-业务数据上链SDK实现
合约的编写基于springboot : https://github.com/FISCO-BCOS/spring-boot-starter pragma solidity ^0.4.24; cont ...
js实现转盘抽奖
大转盘抽奖,主要通过css3的"transform:rotate(0deg)"属性来控制元素的旋转角度来实现. 通常,抽奖的过程需要渐进的效果,所以直接通过旋转属性写比较繁琐. 这 ...
Hadoop框架：Yarn基本结构和运行原理
本文源码:GitHub·点这里 || GitEE·点这里一.Yarn基本结构 Hadoop三大核心组件:分布式文件系统HDFS.分布式计算框架MapReduce,分布式集群资源调度框架Yarn.Ya ...

mysql海量数据优化

mysql海量数据优化的更多相关文章

随机推荐

热门专题