原文地址:   https://blog.csdn.net/daiqiulong2/article/details/86546446?tdsourcetag=s_pcqq_aiomsg

年纪大了,慢慢的写技术文档也不皮了。一五一十的说说清楚, 问题是什么, 解决方案又是什么。 中规中矩的写。

SQL_ID:  1m6akd1s2144u, 执行成本: 40万次/h  3000逻辑读/次。

TOP10SQL的问题类似, 现在分析优化d4wcdsskp0f47

d4wcdsskp0f47  SQL和这个SQL类似。

SELECT * FROM (SELECT XX.*, ROWNUM AS RN FROM (select count(*) from CUST_YC_APP.PARTY_CERT P inner join CUST_YC_APP.CUSTOMER C on P.PARTY_ID = C.PARTY_ID and C.STATUS_CD = '1100' where P.PARTY_ID in (:1 ) and P.STATUS_CD in (:2 ) and P.IS_DEFAULT = '1') XX WHERE ROWNUM <= 1000 ) XXX WHERE RN > 0

执行计划:

执行计划中有笛卡尔积, 但是问题并不在笛卡尔积中。(好多DBA看到笛卡尔集就说笛卡尔集有性能问题,其实是不严谨的,的确很多笛卡尔集是有性能问题,但是此处不是最主要的问题)

查询中绑定变量的值如:B1:15151722241919  B2: ‘1000’

带入到SQL中查询 只9逻辑读。

查询性能瓶颈:

通过采样分析,更多的性能消耗在执行计划的第9步。也就在C表(CUSTOMER)的回表上。

SQL中得出C表用到两个字段 C.PARTY_ID,C.STATUS_CD。 PARTY_ID上建有索引,回表就是为了访问STATUS_CD字段。

因此建议建立索引index  C ( PARTY_ID, STATUS_CD ); 这样可以避免回表。

针对该SQL 优化建议建立索引,即可。

猜测根本原因:

是否是部分由于C表  PARTY_ID某些特定值过多,造成大量会表。

查询表中的数据分布以及绑定变量中的值。

查询数据分布:C表 PARTY_ID字段的选择性 98%,但是有个值,重复率非常高。

查询数据分布以及关联绑定变量。

(这个SQL只表示这些值在绑定变量中出现过, 但是出现的频率未知。。。。但能说明问题)

这个SQL表明,部分不均匀的

果然当PARTY_ID = 15151723602037, 回表需要 回10万次。

用auto trace 中单次执行需要消耗逻辑读7770。 针对该问题已经有相关建议。

下文是探讨 针对该表数据分布以及SQL 如何进一步优化。

既然数据分布不均衡,是否可以通过收集直方图来改善性能? 答案是否定的。

建立测试表: CUSTOMER_test

create table  CUSTOMER_test tablespace TBS_CUST_DATA as

select * from   CUST_YC_APP.CUSTOMER C ;

create index  idx_pid on CUSTOMER_test(PARTY_ID);

收集直方图:

begin

DBMS_STATS.GATHER_TABLE_STATS(OWNNAME          => 'CHECKDB',

TABNAME          => 'CUSTOMER_TEST',

ESTIMATE_PERCENT => 50,

METHOD_OPT       => 'for columns PARTY_ID size skewonly',

DEGREE           => 2,

GRANULARITY      => 'ALL',

CASCADE          => TRUE);

END;

执行SQL:SQL效率更差。 15万逻辑读/次

回到SQl中。关键部分:

需要确认是否可以改成半连接, ( 业务那边是要确认是否可以等价改写,此处讨论这种数据分布情况下如何实施优化 )

因为针对数据分布不均衡半连接效果比较好。

改写SQL:

SELECT *

FROM (SELECT XX.*, ROWNUM AS RN

FROM (select count(1)

from CUST_YC_APP.PARTY_CERT P

where P.PARTY_ID in (15151723602037)

and  P.PARTY_ID in  ( select /*+ nl_sj index(c) */   C.PARTY_ID from  checkdb.CUSTOMER_test  C where C.STATUS_CD = '1100' )

and P.STATUS_CD in ('1000')

and P.IS_DEFAULT = '1') XX

WHERE ROWNUM <= 1000) XXX

WHERE RN > 0;

9 逻辑读/次. (不添加hints 就会走全表,成本1286次/S )

不添加hints 就会走全表,成本1286次/S

SQL无法自动走用好的执行计划, 需要绑定hints才走。 如何自动走好的执行计划??

答案

1 删除直方图。

2设置数据选择性, 综合比较选择性设置成 30% 比较好。

(选择性设置成30, 只要数据总量 * 30% 即可)

删除直方图, 设置选择性。

begin

dbms_stats.delete_column_stats(OWNNAME          => 'CHECKDB',

TABNAME          => 'CUSTOMER_TEST',

colname =>'PARTY_ID',

col_stat_type=>'HISTOGRAM' );

end;

begin

DBMS_STATS.set_column_stats(OWNNAME          => 'CHECKDB',

TABNAME          => 'CUSTOMER_TEST',

colname =>'PARTY_ID',distcnt => 1645919);

end;

这次测试不添加hints的情况下, 是否能走最好的执行计划。

果然走nested_loop 半连接  并且走 C(PARTY_ID) 索引 (图就不贴了)。9逻辑读

另外也测试了SQL

select count(1)

from CHECKDB.CUSTOMER_TEST t

where PARTY_ID = 15151723602037 and t.status_cd  in ('1100');

收集直方图: 走全表扫描  156935逻辑读/次

删除直方图: 走索引扫描  7903逻辑读/次

至于什么情况下收集直方图,删除直方图,收集统计信息。 这个不多说了。   看我之前博客设置统计信息优化SQL的案例。
---------------------
作者:越烟
来源:CSDN
原文:https://blog.csdn.net/daiqiulong2/article/details/86546446
版权声明:本文为博主原创文章,转载请附上博文链接!

SQL瓶颈分析,以及适应最佳执行计划的探讨的更多相关文章

  1. 浅析SqlServer简单参数化模式下对sql语句自动参数化处理以及执行计划重用

    我们知道,SqlServer执行sql语句的时候,有一步是对sql进行编译以生成执行计划, 在生成执行计划之前会去缓存中查找执行计划 如果执行计划缓存中有对应的执行计划缓存,那么SqlServer就会 ...

  2. SQL Server INSET/UPDATE/DELETE的执行计划

    DML操作符包括增删改查等操作方式. insert into Person.Address (AddressLine1, AddressLine2, City, StateProvinceID, Po ...

  3. SQL Server 性能调优 之执行计划(Execution Plan)调优

    SQL Server 存在三种 Join 策略:Hash Join,Merge Join,Nested Loop Join. Hash Join:用来处理没有排过序/没有索引的数据,它在内存中把 Jo ...

  4. SQL Server如何查看存储过程的执行计划

    有时候,我们需要查看存储过程的执行计划,那么我们有什么方式获取存储过程的历史执行计划或当前的执行计划呢? 下面总结一下获取存储过程的执行计划的方法. 1:我们可以通过下面脚本查看存储过程的执行计划,但 ...

  5. 不会看 Explain执行计划,劝你简历别写熟悉 SQL优化

    昨天中午在食堂,和部门的技术大牛们坐在一桌吃饭,作为一个卑微技术渣仔默默的吃着饭,听大佬们高谈阔论,研究各种高端技术,我TM也想说话可实在插不上嘴. 聊着聊着突然说到他上午面试了一个工作6年的程序员, ...

  6. 使用Oracle执行计划分析SQL性能

    执行计划:一条查询语句在ORACLE中的执行过程或访问路径的描述.即就是对一个查询任务,做出一份怎样去完成任务的详细方案. 如果要分析某条SQL的性能问题,通常我们要先看SQL的执行计划,看看SQL的 ...

  7. SQL Server 执行计划分析

    当一个查询到达数据库引擎时,SQL Server执行两个主要的步骤来产生期望的查询结果: 第一步:查询编译,生成查询计划. 第二步:执行这个查询计划. 1. 用于演示分析执行计划的查询语句 /* 查询 ...

  8. SELECT TOP 1 比不加TOP 1 慢的原因分析以及SELECT TOP 1语句执行计划预估原理

    本文出处:http://www.cnblogs.com/wy123/p/6082338.html 现实中遇到过到这么一种情况: 在某些特殊场景下:进行查询的时候,加了TOP 1比不加TOP 1要慢(而 ...

  9. SQL Server 执行计划缓存

    标签:SQL SERVER/MSSQL SERVER/数据库/DBA/内存池/缓冲区 概述 了解执行计划对数据库性能分析很重要,其中涉及到了语句性能分析与存储,这也是写这篇文章的目的,在了解执行计划之 ...

随机推荐

  1. 克拉克拉(KilaKila):大规模实时计算平台架构实战

    克拉克拉(KilaKila):大规模实时计算平台架构实战 一.产品背景:克拉克拉(KilaKila)是国内专注二次元.主打年轻用户的娱乐互动内容社区软件.KilaKila推出互动语音直播.短视频配音. ...

  2. python基础1--安装、package、数据类型

    1.下载python 下载地址https://www.python.org/downloads/ 2.Package以及数据类型 自带package和外部package 自带package举例: os ...

  3. Qt显示Linux desktop natification气泡提示框

    在现代Linux桌面环境上我们时常可以看到类似的消息框: 这些消息框常用在如下场景: 即时聊天软件的新消息 闹钟定时提示 电池电量提示 邮件消息 长耗时操作的完成提示 在freedesktop.org ...

  4. linux yum配置代理

    yum里面可以单独设置代理就是yum源的参数加proxy=“http://ip:PORT”即在/etc/yum.conf中加入下面几句.proxy=http://210.45.72.XX:808pro ...

  5. web中的——作者也不知道这里面写的啥

    1.使用超链接<a href="/Default/Index">添加</a><a href="#">返回显示信息</a ...

  6. 零基础学Python--------第7章 面向对象程序设计

    第7章 面向对象程序设计 7.1 面向对象概述 面向对象(Object Oriented)的英文缩写是OO,它是一种设计思想.从20世纪60年代提出面向对象的概念到现在,它已经发展成为一种比较成熟的编 ...

  7. 在Jenkins管道中添加Webhook

    你有没有尝试过在Jenkins中添加GitHub webhook?在这篇博客中,我将演示在您的管道中添加webhook的最简单方法. 首先,什么是webhook?webhook的概念很简单.webho ...

  8. vue 路由的使用

    ue-router是Vue.js官方的路由插件,它和vue.js是深度集成的,适合用于构建单页面应用.vue的单页面应用是基于路由和组件的,路由用于设定访问路径,并将路径和组件映射起来.传统的页面应用 ...

  9. Shell基础命令(一)

    Shell 教程 Shell 是一个用 C 语言编写的程序,它是用户使用 Linux 的桥梁.Shell 既是一种命令语言,又是一种程序设计语言. Shell 是指一种应用程序,这个应用程序提供了一个 ...

  10. Android LayoutInflater 类分析

    作为一名Android开发者,写页面是最普通不过的事情了,在编写页面的时候,系统给提供了两种形式,一种形式是通过XML的方式进行编写,还有一种形式是通过Java代码直接编写   我们知道Android ...