Oracle SQL性能优化 - 根据大表关联更新小表

需求：

　　小表数据量20w条左右，大表数据量在4kw条左右，需要根据大表筛选出150w条左右的数据并关联更新小表中5k左右的数据。

性能问题：

对筛选条件中涉及的字段加index后，如下常规的update语句仍耗时半小时左右。

  UPDATE WMOCDCREPORT.DM_WM_TRADINGALL A

  SET

  (

    A.RELATIONSHIPNO,

    A.PACKAGE

  )

  =

  (SELECT

                B.RELATIONSHIPNO,

    CASE

                                WHEN (B.SEGMENTCODE=''

                                                OR B.SEGMENTCODE   =''

                                                OR B.SEGMENTCODE   =''

                                                OR B.SEGMENTCODE   ='')

                                                THEN 'BC'

                                WHEN (B.SEGMENTCODE='')

                                                THEN 'PW'

                                WHEN (B.SEGMENTCODE='')

                                                THEN 'MM'

                                WHEN (B.SEGMENTCODE='')

                                                THEN 'EB'

                                WHEN (B.SEGMENTCODE='')

                                                THEN 'PB'

                                ELSE B.SEGMENTCODE

    END

    FROM DATACORE.DF_CUST_HISTORY B

    WHERE B.ACCOUNT_NO=A.SETTLEMENTACCOUNT

    AND B.DATA_DATE = '2018-11-30'

    AND rownum        = 1

  )

  WHERE A.MONTH = 'SEP'

  AND A.DATA_DATE = '2018-09-30'

  AND EXISTS

  (

    SELECT 1 FROM DATACORE.DF_CUST_HISTORY C

    WHERE C.ACCOUNT_NO=A.SETTLEMENTACCOUNT

    AND C.DATA_DATE = '2018-11-30'

  );

经过数次搜索，发现同关联更新有关的技术博客基本上是更新大表数据，比如here.(使用批量更新)。

也分析过执行计划，同预想的性能瓶颈一样，主要由以下两个方面造成

(1) DATACORE.DF_CUST_HISTORY数据量太大，本想将某一天的数据select出来提前插入到一张表中，但估计效果不会太明显，因为插入150w条数据本身也会耗时很长。

(2) 需要更新5k条数据，且每条数据需要到150w条数据中做关联查询（时间主要耗在这）。

性能优化：

小表5k，大表150w，理所应当想到采用join的方式并保留小表中的数据。接下来是怎么把join后的数据更新到小表中(不用update)？merge into!

这里还涉及到一个小问题，merge into中的on条件需要保证一一对应，而大表中很可能出现重复的ACCOUNT_NO，所以需要排重，怎么做？用partition by !

另外，关于join中on条件和where条件的比较。

优化后的sql（运行时间8-10s）：

merge into wmocdcreport.dm_wm_tradingall a

using (

    select

       t.rid,

       t.settlementaccount,

       tx.relationshipno,

       case

         when (tx.segmentcode = '' or tx.segmentcode = '' or

              tx.segmentcode = '' or tx.segmentcode = '') then

          'BC'

         when (tx.segmentcode = '') then

          'PW'

         when (tx.segmentcode = '') then

          'MM'

         when (tx.segmentcode = '') then

          'EB'

         when (tx.segmentcode = '') then

          'PB'

         else

          tx.segmentcode

       end as package

    from (

        select rowid rid,

            dwt.settlementaccount

        from wmocdcreport.dm_wm_tradingall dwt

        where dwt.month = 'SEP'

        and dwt.data_date = '2018-09-30'

    ) t

    inner join

    (

        select row_number() over (partition by c.account_no order by c.relationshipno) seq,

              c.account_no,

              c.relationshipno,

              c.segmentcode

        from datacore.df_cust_history c

        where c.data_date = '2018-11-30'

    ) tx

    on tx.account_no = t.settlementaccount and tx.seq = 1

) b on (a.rowid = b.rid)

when matched then

   update set a.relationshipno = b.relationshipno,

              a.package        = b.package;

Oracle SQL性能优化 - 根据大表关联更新小表的更多相关文章

Oracle SQL性能优化技巧大总结
http://wenku.baidu.com/link?url=liS0_3fAyX2uXF5MAEQxMOj3YIY4UCcQM4gPfPzHfFcHBXuJTE8rANrwu6GXwdzbmvdV ...
Oracle SQL 性能优化技巧
Select语句完整的执行顺序: SQL Select语句完整的执行顺序: 1. from子句组装来自不同数据源的数据: 2.where子句基于指定的条件对记录行进行筛选: 3.group by子句将 ...
ORACLE SQL性能优化(全)
ORACLE SQL性能优化(全) http://wenku.baidu.com/view/b2aaba3887c24028915fc337.html
Oracle SQL性能优化
(1) 选择最有效率的表名顺序(只在基于规则的优化器中有效):ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table) ...
Oracle SQL性能优化（转）
(1) 选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table ...
<转>Oracle SQL性能优化
原文链接:http://www.cnblogs.com/rootq/archive/2008/11/17/1334727.html (1) 选择最有效率的表名顺序(只在基于规则的优化器中有效 ...
oracle sql 性能优化
目录[-] (1) 选择最有效率的表名顺序(只在基于规则的优化器中有效):ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table ...
[转]Oracle SQL性能优化
本文转自:http://www.cnblogs.com/rootq/archive/2008/11/17/1334727.html (1) 选择最有效率的表名顺序(只在基于规则的优化器中有效 ...
Oracle SQL性能优化总结
1. SQL语句执行步骤语法分析> 语义分析> 视图转换 >表达式转换> 选择优化器 >选择连接方式 >选择连接顺序 >选择数据的搜索路径 >运行“执 ...

随机推荐

Python之Django框架
1.Django简介 Python下有多款不同的 Web 框架,Django是最有代表性的一种.许多成功的网站和APP都基于Django. Django是一个开源的Web应用框架,由Python写成. ...
极致 Web 性能 —— SPA 性能指南
前言前端框架时代,为开发体验.效率与页面性能带来,非常大的革命.大家纷纷拿起一系列打包工具(webpack/parcel etc.),配合一系列加载器快速搭建起一个 SPA 页面. SPA 应用带来 ...
[LeetCode] Find Peak Element 二分搜索
A peak element is an element that is greater than its neighbors. Given an input array where num[i] ≠ ...
Android系统启动过程【转】
转自:http://www.cnblogs.com/bastard/archive/2012/08/28/2660389.html Android系统启动过程首先Android框架架构图:(来自网上 ...
吉首大学问题 L: 小李子的老年生活
时间限制: 1 Sec 内存限制: 128 MB提交: 719 解决: 27 题目描述小李子有n-1个朋友,分别编号为1..n-1,小李子的编号是n ,小李子的表面朋友的编号会与小李子编号互质 ...
Codeforces 615D Multipliers (数论)
题目链接 Multipliers 题意很明确. 很显然答案可以表示成X ^ EXP % MOD 首先我们令N为输入的n个数的乘积.并且设N = (P1 ^ C1) * (P2 ^ C2) * ... ...
bzoj1455&&luogu2713罗马游戏
罗马游戏题目描述罗马皇帝很喜欢玩杀人游戏. 他的军队里面有n个人,每个人都是一个独立的团.最近举行了一次平面几何测试,每个人都得到了一个分数. 皇帝很喜欢平面几何,他对那些得分很低的人嗤之以鼻. ...
Fennec VS. Snuke --AtCoder
题目描述 Fennec and Snuke are playing a board game.On the board, there are N cells numbered 1 through N, ...
lock与monitor的区别
1.Lock 只能对引用对象加锁 Lock锁定区间内可以对锁定值修改而不发生运行时错误,通常也会采用此种修改方式.这种方式又有点类同于使用Monitor.Wait取得资源,并对这个资源进行操作. 用法 ...
app中获取应用名称，版本等信息的方法
在app中,我们有时候需要显示一些信息,例如名称,版本等等...如果用写死的方式可能不太好,我们可以动态的读取.应用的信息主要是在info.plist这个文件中,实际就是一个xml文件,以源文件的方式 ...

Oracle SQL性能优化 - 根据大表关联更新小表

Oracle SQL性能优化 - 根据大表关联更新小表的更多相关文章

随机推荐

热门专题