MS SqlSever一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】[转]

对普通开发人员来说经常能接触到上千万条数据优化的机会也不是很多，这里还是要感谢公司提供了这样的一个环境，而且公司让我来做优化工作。当数据库中的记录不超过10万条时，很难分辨出开发人员的水平有多高，当数据库中的记录条数超过1000万条后，还是蛮能考验开发人员的综合技术能力。

当然不是每个公司都能请得起专业的DBA，话又说过来专业的DBA也未必能来我们公司长期工作，这就不只是薪资待遇问题了还会涉及到人家的长期发展规划了，当然我也不是专业的DBA，本着能把问题解决好就是好猫的理念。

我们先看图，数据库中的记录数如下：记录数为10581490条同时还需要从另外一个表读取7万多条数据。

页面运行效果如下：这是查看某个单位的数据，每页显示16条、记录数1087292条、分页数为67956页。

遇到的难题如下：

1：当客户用了几年后数据变得很庞大分页速度缓慢得要命几乎到了无法忍受的程度。

2：分页到最后一页时往往速度很慢会有死机现象出现，特别是记录条数很多时死机现象比较多。

那再讲讲，解决问题的方法步骤：

1：首先优化数据库、因为程序也很复杂一时也看不过来也不敢乱改，先从数据库字段类型优化开始入手会好很多。

先把数据库里的 datetime 都修改为 smalldatetime，数据库变小了几百M很有成就感，最起码磁盘的读取压力减少不少吧。由于数据库数据有上千万条，无法用管理工具修改结构，只能用新建查询执行SQL命令才可以。

会有如下超时现象会发生。

那我们只能用执行查询的方式对表结构进行调整了，每次执行一个SQL指令大概需要10分钟时间才能顺利执行好，数据量实在是太大了。

2：接着再优化，数据库索引，原先的索引很乱可以理解为是乱来的所以我全部干掉重新进行了组织。

把多余的索引先通通干掉，然后重新建立索引，因为记录数太庞大了，有多余的索引会使数据库变大很庞大，给他先减轻减轻体重。

把主键设置为倒序的、非聚集的，这样的好处是可以把最新的数据排序在最前面。

把主要查询的条件设置为索引，Group By 的放第一个位置然后设置为聚集索引，这样的好处时查询时会快很多很多，普通所以没这个效率高，数据实在是太庞大了，超过了1000万条数据后，对比一下还是很明显的，都能感觉得到。

完成以上2个步骤后分页速度快了很多最起码没死机现象了，还有一点遗憾是当数据量大时最后一页的分页速度还是有些慢，有些难以忍受的感觉，但是最起码不会死机了。

3：接着重点优化，数据库分页的存储过程，最后一页难以忍受的问题先解决一下。分页是用了 SELECT TOP N 的反转的方式，我把最后一页到底获取多少条记录准确数字计算出来，适当的修改了一下最后一页慢得死去活来的问题，得到了适当的环节，虽然没能彻底解决也速度明显快了一些，由于写的这个分页程序也有些复杂，我也不敢乱动，就把问题解决好就完事大吉的目的了，不去惹更多的麻烦了。

4：对比一下数据库结构优化后的前后如下图

索引优化前索引占用空间 2706.109M

索引优化后索引占用空间 520.805M

我想就这么一个1000w条记录的表光索引就优化了2200M空间，就单单这个也提高不少性能了。

5：接着重点优化，程序代码部分了，其实代码优化是在索引优化之前的，因为先读懂了代码、读懂了业务逻辑才好优化索引，这边文章写着写着顺序有些颠倒了，大家心里有数就可以了，我还是按照我的思路继续写吧。

在上图的企业编号、企业名称等，在程序里都进行了LIKE处理，当数据库记录超过1000万条时，对字符进行Like操作，那真是会要命的，毕竟那么多数据都进行一次匹配，虽然电脑的运算速度很快，但是上千万条记录，这么被计算过一下，能快到哪里去啊？

改进方法：

A: 输入企业编号、企业名称修改为模糊查询，能明确定位一个药店的名称。

B: 若已经获得企业编号了，不再匹配企业名称，而且企业编号用 = 来判断，并把企业编号进行索引。

海量数据库分页优化总结：

折腾了接近1周左右，终于把这个1千多万条记录的数据表给优化好了，难题也解决好了虽然不太科学也不专业也缺少理论依据、试验数据、图表对比、性能调试工具等等，但是还好把问题都解决好了，老鼠抓到了就是好猫咪了哈哈。

数据库进行了彻底的翻天覆地的优化、程序代码也进行了彻底的翻天覆地的优化后，分页速度飞快了。每页显示16条、记录数1087292条、分页数为67956页，每页分页速度都完全在3秒内，最后一页也不会死机了，也蛮快的足够可以忍受了。

等有空时，再把最后一页分页速度慢的问题再深入解决一下，先不去惹麻烦了稍微休息一下再说。

优化的每个动作需要10分钟左右才会执行好，若做错一次基本上就代表半个小时白忙乎了，还需要删除掉，再重新执行修正过的SQL语句，所以一天下来优化的成果并不会非常明显、需要几天时间才能优化好。

销售记录表 TXSJL 记录数：1058 1490

批发销售记录表 TXSJL 记录数： 7 0814

日期区间	药店名称	药品数量	记录条数	第一页	第十页	最后一页
2010-08-01 2010-08-31	330903000011 舟山市普陀区芦花药店	4751	2261	0.235 秒	0.143 秒	0.21 秒
2010-08-01 2010-08-31	330903000142 舟山市万民大药房有限公司普陀分公司	70 5668	2 1019	0.47 秒	0.275 秒	0.2 秒
2010-07-01 2010-09-30	330903000011 舟山市普陀区芦花药店	1 2952	6580	0.268 秒	0.115 秒	0.155 秒
2010-07-01 2010-09-30	330903000138 舟山布衣大药房有限公司平阳浦分公司	136 8949	41 9478	0.26 秒	0.205 秒	0.815 秒
2010-04-01 2010-09-30	330903000011 舟山市普陀区芦花药店	2 6068	12423	0.155 秒	0.155 秒	0.125 秒
2010-04-01 2010-09-30	330903000138 舟山布衣大药房有限公司平阳浦分公司	260 6635	80 9012	0.29 秒	0.315 秒	0.74 秒
2010-01-01 2010-09-30	330903000048 舟山市布衣大药房有限公司	850 1598	217 3053	0.275 秒	0.34 秒	0.745 秒

MS SqlSever一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】[转]的更多相关文章

[转]SqlSever2005 一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】一周搞定
对普通开发人员来说经常能接触到上千万条数据优化的机会也不是很多,这里还是要感谢公司提供了这样的一个环境,而且公司让我来做优化工作.当数据库中的记录不超过10万条时,很难分辨出开发人员的水平有多高,当 ...
SqlSever2005 一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】
对普通开发人员来说经常能接触到上千万条数据优化的机会也不是很多,这里还是要感谢公司提供了这样的一个环境,而且公司让我来做优化工作.当数据库中的记录不超过10万条时,很难分辨出开发人员的水平有多高,当数 ...
SqlSever2005 一千万条以上记录分页数据库优化经验总结
http://www.cnblogs.com/jirigala/archive/2010/11/03/1868011.html 待测试???
用一条sql取得第10到第20条的记录-Mssql数据库
因为id可能不是连续的,所以不能用取得10<id<20的记录的方法. 有三种方法可以实现: 一.搜索前20条记录,指定不包括前10条语句: select top 20 * from tb ...
MySQL的一次优化记录（IN子查询和索引优化）
这两天实习项目遇到一个网页加载巨慢的问题(10多秒),然后定位到是一个MySQL查询特别慢的语句引起的: SELECT * FROM ( SELECT DISTINCT t.vc_date, t.c_ ...
Oracle数据库delete删除普通堆表千万条记录
Oracle数据库delete删除普通堆表千万条历史记录. 直接删除的影响: 1.可能由于undo表空间不足从而导致最终删除失败的问题: 2.可能导致undo表空间过度使用,影响到其他用户正常操作. ...
记录一次mysql导入千万条测试数据过慢的问题！
数据库在没有做任何优化的情况下,使用存储过程,插入1千万条测试数据. CREATE PROCEDURE addmaxdata(IN n int) BEGIN DECLARE i INT DEFAULT ...
【MyBatis】【SQL】没有最快，只有更快，从一千万条记录中删除八百万条仅用1分9秒
这次直接使用delete from emp where cdate<'2018-02-02',看看究竟会发生什么. Mapper里写好SQL: <?xml version="1. ...
WebGIS项目中利用mysql控制点库进行千万条数据坐标转换时的分表分区优化方案
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1. 背景项目中有1000万条历史案卷,为某地方坐标系数据,我们的真实 ...

随机推荐

C#使用原生的Directx和OpenGL绘图
原文混合语言编程-C#使用原生的Directx和OpenGL绘图的方法由于项目需要做一些图形展示,所以就想到了使用Directx和OpenGL来绘图,但项目准备使用C#来开发(大家比较熟悉C#), ...
dede各种运用[转]
文章正文页常用函数: 1.相应文章上下文调用: {dede:prenext function="str_replace(' 下一篇:','<'.'br'.' />下一篇: 2.文 ...
Spring Bean 生命周期2
在spring中,从BeanFactory或ApplicationContext取得的实例为Singleton,也就是预设为每一个Bean的别名只能维持一个实例,而不是每次都产生一个新的对象使用Sin ...
[C语言]（一）第一个Windows 32 API的窗口程序
#include <windows.h> LRESULT CALLBACK WndProc(HWND, UINT, WPARAM, LPARAM); int WINAPI WinMain( ...
改变select组件的option选中状态的快捷方法
以前我都是在<option>标签处通过判断value是否与其中一个相同然后输出selected="selected"来处理的,今天发现可以直接能过Js改变<sel ...
c# as
as:用于检查在兼容的引用类型之间执行某些类型的转换. Employee myEmployee = myObject as Employee; if (myEmployee != null) { } ...
JDBC中的事务-Transaction
事务-Transaction 某些情况下我们希望对数据库的某一操作要么整体成功,要么整体失败,经典的例子就是支付宝提现.例如我们发起了支付宝到银行卡的100元提现申请,我们希望的结果是支付宝余额减少1 ...
eclipse导入不到嵌套的项目
search for nested projects搜索不到嵌套项目
Spring SpEL表达式的理解
Spring的IOC本质就一个容器,也就是一个对象的工厂,我们通过配置文件注册我们的Bean对象,通过他进行对象的组装与床架. SpEL表达式就是一种字符串编程,类似于JS里面的EVAL的作用,通过它 ...
ReferenceError: Sys is not defined
项目框架MVC3 <form action="/Organization/Update" method="post" onclick="Sys. ...

MS SqlSever一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】[转]

MS SqlSever一千万条以上记录分页数据库优化经验总结【索引优化 + 代码优化】[转]的更多相关文章

随机推荐

热门专题