sql查询未走索引问题分析之查询数据量过大

前因：

客户咨询，有一个业务sql（代表经常被执行且重要），全表扫描在系统占用资源很高（通过ash报告查询得到信息）

思路：

1.找到sql_text,sql_id

2.查看执行计划

3.查询sql涉及对象的对象数据量，段大小，行数量，where条件列，是否存在索引，列的选择读情况如何

4.总结，优化整改

1.找到sql_text,sql_id

094cmrxrahdy2

SELECT ~10个列名称（由于设计用户信息，因此部分信息不再详细说明）

FROM Prescription

WHERE ProcFlg= AND(Group_No= OR Group_No= OR Group_No=) AND MachineNo<> ORDER BY Presc_Class DESC, PrescriptionNo, SeqNo;

2.查看执行计划

SQL> select * from table(dbms_xplan.display_cursor('094cmrxrahdy2',format=>'IOSTATS LAST'));

PLAN_TABLE_OUTPUT

---------------------------------------------------------------------------------------------

Plan hash value:

----------------------------------------------------

| Id | Operation | Name | E-Rows |

----------------------------------------------------

|  | SELECT STATEMENT | | |

|  | SORT ORDER BY | | 335K|

|*  | TABLE ACCESS FULL| PRESCRIPTION | 335K|

----------------------------------------------------

PLAN_TABLE_OUTPUT

-----------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

 - filter(("PROCFLG"= AND INTERNAL_FUNCTION("GROUP_NO") AND "MACHINENO"<>))

INTERNAL_FUNCTION 内部函数，一般执行计划看到这个需要特殊关注，但是本次确认输入的数值类型等同于字段类型

GROUP_NO NOT NULL NUMBER(2)

3.查询sql涉及对象的对象数据量，段大小，行数量，where条件列，是否存在索引，列的选择读情况如何

1)查询表所在的用户
 select owner,object_name,object_type,status from dba_objects where object_name='PRESCRIPTION'

OWNER                OBJECT_NAME          OBJECT_TYPE         STATUS

-------------------- -------------------- ------------------- -------

PUBLIC               PRESCRIPTION         SYNONYM             VALID

PHARMACY             PRESCRIPTION         TABLE               VALID
2）查询表的段大小

select sum(bytes)/1024/1024 from dba_segments where segment_name='PRESCRIPTION' and owner='PHARMACY';
SUM(BYTES)/1024/1024
--------------------
450

3）查询表上的索引，及索引对应列名称

select index_owner,index_name,column_name,COLUMN_POSITION from dba_ind_columns where table_owner='PHARMACY' and table_name='PRESCRIPTION'

INDEX_OWNER INDEX_NAME COLUMN_NAME COLUMN_POSITION
------------------------------ -------------------- -------------------- ---------------
PHARMACY PRESCRIPTION_IDX1 PRESC_CLASS 1
PHARMACY PRESCRIPTION_IDX1 PRESCRIPTIONNO 2
PHARMACY PRESCRIPTION_IDX1 SEQNO 3
PHARMACY PRESCRIPTION_IDX2 PROCFLG 1
PHARMACY PRESCRIPTION_IDX3 PROCFLG 1
PHARMACY PRESCRIPTION_IDX3 GROUP_NO 2
PHARMACY PRESCRIPTION_IDX3 MACHINENO 3
PHARMACY PK_PRESCRIPTION PRESCRIPTIONNO 1
PHARMACY PK_PRESCRIPTION SEQNO 2

9 rows selected.

--第一，where 条件的三个列，再上述结果中，均存在对应的记录，所以基本可以排除无索引导致全表扫描的问题

--第二，产生疑问，存在索引，为何未使用索引？？？猜测数据倾斜严重，SQL查询数据量过大，统计信息不准确等信息导致的问题，需要进一步进行分析

4）查询表行数量，及最后一次收集统计信息的时间

SQL> select num_rows，last_analyzed from dba_tables where owner='PHARMACY' and table_name='PRESCRIPTION';

NUM_ROWS LAST_ANALYZED
-----------------------------
1560341 2018-11-27 22:01:31

5）查询where 条件列的选择性（及去重后的行数量）

WHERE ProcFlg=0 AND(Group_No=0 OR Group_No=1 OR Group_No=99) AND MachineNo<>99

看起来最差的选择性<>条件MachineNo列

查询发现，表总160万行，MachineNo列只有一个值1，也不存在Null值，where条件<>99,是无价值的条件，但是不至于影想走索引，此条件近乎无用

SQL> select count(*),count(distinct MachineNo) from PHARMACY.PRESCRIPTION;
COUNT(*) COUNT(DISTINCTMACHINENO)
---------- ------------------------
1604912 1
--
SQL> select MachineNo,count(*) from PHARMACY.PRESCRIPTION group by MachineNo;
MACHINENO COUNT(*)
---------- ----------
1 1604912

看起来选择性最好的条件ProcFlg=0， 符合这个条件的数值表中存在49万条记录，占表中记录的1/4,选择性已经很差了

SQL> select count(*),count(distinct ProcFlg) from PHARMACY.PRESCRIPTION;
COUNT(*) COUNT(DISTINCTPROCFLG)
---------- ----------------------
1604912 4
select ProcFlg,count(*) from PHARMACY.PRESCRIPTION group by ProcFlg;
PROCFLG COUNT(*)
---------- ----------
-1 7
1 1110365
2 995
0 493545

看起来选择性中等的Group_No=0 OR Group_No=1 OR Group_No=99--符合条件的数值足有110万条记录

select count(*),count(distinct Group_No) from PHARMACY.PRESCRIPTION;
COUNT(*) COUNT(DISTINCTGROUP_NO)
---------- -----------------------
1604912 2
select Group_No,count(*) from PHARMACY.PRESCRIPTION group by Group_No;
GROUP_NO COUNT(*)
---------- ----------
1 1111367
2 493545

--组合过滤后，只有4种可能性，对于本次sql，

--条件ProcFlg=0 存在50万条记录
--Group_No 1 or 0 or 99 返回１１０万行记录

－－全表 1604912　－－１６０万行记录，提取记录１１０/１６０＝６８．５％数据量，执行效率过低，还不如走全表扫描

SQL> select count(*),count(distinct ProcFlg||' '||Group_No) from PHARMACY.PRESCRIPTION;

COUNT(*) COUNT(DISTINCTPROCFLG||''||GROUP_NO)
---------- ------------------------------------
1604914 4

4.总结，优化整改

1）该SQL走全表扫描是正确的，全表扫描比回表查询65%全表数据量更快

2）提高该SQL性能，无法从索引入手，因为SQL是查询10个列，且数据量过大，不适用索引快速检索数据

3）建议开发人员，重新针对业务逻辑，规划新表：

01对每个表建立主键约束（唯一值），让业务SQL能快速定位一个唯一的记录，通过索引，快速检索少量数据，减少资源的消耗（逻辑读等消耗）；

02或者根据应用需求，将此表进行拆分多个小表，这样即使是全表扫描，相对来说量级别减少，查询时间可能会提升，但是资源消耗并未降低（逻辑读等消耗）；

sql查询未走索引问题分析之查询数据量过大的更多相关文章

sql server 大数据，统计分组查询，数据量比较大计算每秒钟执行数据执行次数
-- 数据量比较大的情况,统计十分钟内每秒钟执行次数 ); -- 开始时间 ); -- 结束时间 declare @num int; -- 结束时间 set @begintime = '2019-08 ...
sql server编写通用脚本自动统计各表数据量心得
工作过程中,如果一个数据库的表比较多,手工编写统计脚本就会比较繁琐,于是摸索出自动生成各表统计数据量脚本的通用方法,直接上代码: /* 脚本来源:https://www.cnblogs.com/zha ...
Mysql中使用JDBC流式查询避免数据量过大导致OOM
一.前言 java 中MySQL JDBC 封装了流式查询操作,通过设置几个参数,就可以避免一次返回数据过大导致 OOM. 二.如何使用 2.1 之前查询 public void selectData ...
mysql慢查询Slow Query Log和未使用索引(Not Using Indexes)查询配置和使用
mysql的“慢查询”指的是超过了允许的最大查询时间(long_query_time)的sql语句,而“未使用索引”查询顾名思义就是查询语句没有使用到索引的sql语句. 慢查询配置和使用在msyql ...
SQL IN 一定走索引吗？
摘要 IN 一定走索引吗?那当然了,不走索引还能全部扫描吗?好像之前有看到过什么Exist,IN走不走索引的讨论.但是好像看的太久了,又忘记了.哈哈,如果你也忘记了MySQL中IN是如何查询的,就来复 ...
oracle like模糊查询不能走索引？
这里要纠正一个网上很多教程说的模糊匹配不能走索引的说法,因为在看<收获,不止SQL优化>一书,里面举例说到了,并且自己也跟着例子实践了一下,确实like一些特殊情况也是可以走索引的例子来 ...
like模糊查询是否走索引
1.模糊查询后通配走索引前通配走全表 2.where条件用in或or 不会走索引索引的本质是平衡b+数,是为了方便查询的平衡多路查找树 B-Tree相比,B+Tree有以下不同点: 每个节点的 ...
(转)SQL server 2005查询数据库表的数量和表的数据量
本文转载自:http://hi.baidu.com/ajyajyajy/item/4e2a7f4dc83393d2c1a592c1 use DBNAMEgoselect * from sysobjec ...
excel 数据量较大边查询边输入到excel表格中
public Resultmodel getexpenseMessagx(HttpServletResponse response, String date1, String date2) { lon ...

随机推荐

[contest 781] 9.6
[contest 781] 9.6 - XJOI czx的温暖题... T1 军训
SpringMVC+HibernateValidator，配置在properties文件中的错误信息回显前端页面出现中文乱码
问题: 后台在springMVC中使用hibernate-validator做参数校验的时候(validator具体使用方法见GOOGLE),用properties文件配置了校验失败的错误信息.发现回 ...
vul/0day/shellcode/payload/poc/exp
vul--泛指漏洞 0day--未公开或虽已公开但还没有修复方法的漏洞 shellcode--远程溢出后执行的那段代码 payload--攻击载荷,送到远端机器执行的整段代码 poc--Proof o ...
reload() 函数
reload() 函数当一个模块被导入到一个脚本,模块顶层部分的代码只会被执行一次. 因此,如果你想重新执行模块里顶层部分的代码,可以用 reload() 函数.该函数会重新导入之前导入过的模块.语 ...
span 超出部分换行
span{ word-break: normal; width: auto; display: block; white-space: pre-wrap; word-wrap: break-word; ...
普通程序员，三年成为年薪70w架构师，只因做到了这些
每个程序员.或者说每个工作者都应该有自己的职业规划,如果你不是富二代,不是官二代,也没有职业规划,希望你可以思考一下自己的将来.今天给大家分享的是一篇来自阿里Java架构师对普通程序员的职业建议,希望 ...
OO Summary Ⅲ
规格化设计的发展历史 (这一部分并没有找到答案,于是参考了好黄和温莎莎的blogs) 1950年代,第一次分离,主程序和子程序的分离程序结构模型是树状模型,子程序可先于主程序编写.通过使用库函数来简化 ...
SpringMVC：后台将List转为Json，传值到页面
一.JSP页面 <body> <form name="test" action="getAllStudent" method="po ...
四：（之三）制作镜像和一些docker命令
3.DIY image 3.1如何去掉sudo权限命令,让当前用户拥有操作docker的权限? 3.2 制作一个image: 拉取一个非常小的base image,hello-world.其中是一个可 ...
SQL3-查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_no
题目描述查找各个部门当前(to_date='9999-01-01')领导当前薪水详情以及其对应部门编号dept_noCREATE TABLE `dept_manager` (`dept_no` ch ...

sql查询未走索引问题分析之查询数据量过大

sql查询未走索引问题分析之查询数据量过大的更多相关文章

随机推荐

热门专题