测试merge效率

测试说明：

MERGE是oracle提供的一种特殊的sql语法，非常适用于数据同步场景，即：（把A表数据插到B表，如果B表存在相同主键的记录则使用A表数据对B表进行更新）数据同步的常规做法是先尝试插入，插入失败再进行更新，MERGE比这种常规做法效率高很多。（特别是A与B表基本一致，同步时主键冲突比较多的情况，效率能相差10倍以上）

为了验证MERGE效率，我建了两张表，tab_test_C（初始化生成50000条记录）和tab_test_Q（初始化从tab_test_C生成40000条记录），写了两个plsql脚本，分别将tab_test_C的数据同步到tab_test_Q，看它们效率区别。

第一个脚本使用merge语法，第二个脚本使用常规先插入，出现主键冲突的操作。

测试结果：
使用merge语法的脚本同步数据耗时0.04秒，使用常规操作耗时14.77秒，效率差369倍

测试脚本：

SET SERVEROUTPUT ON

-- 启动计时 以便观察脚本执行时间

SET TIMING ON

SET TIME ON

-- 数据初始化

DROP TABLE tab_test_C;

CREATE TABLE tab_test_C

(

    C1 VARCHAR2(512),

    C2 VARCHAR2(512),

    C3 VARCHAR2(512),

    C4 VARCHAR2(512),

    C5 VARCHAR2(512),

    C6 VARCHAR2(512),

    C7 VARCHAR2(512),

    C8 VARCHAR2(512),

    C9 VARCHAR2(512),

    C10 VARCHAR2(512)

);

DECLARE

    v_total number;

BEGIN

    v_total := 0;

    LOOP

        EXIT WHEN v_total >= 50000;

        for cur in (select owner, object_name, subobject_name, object_id, data_object_id, object_type,

            created, last_ddl_time, timestamp from all_objects where rownum < 101)

        loop

            insert into tab_test_C values (cur.owner, cur.object_name, cur.subobject_name,

            cur.object_id, cur.data_object_id,

            cur.object_type, cur.created,

            cur.last_ddl_time, cur.timestamp, v_total);

            v_total := v_total + 1;

        end loop;

    END LOOP;

    COMMIT;

END;

/

-- 建唯一索引

select count(1) from tab_test_C;

create UNIQUE INDEX uid_test_c_1 on tab_test_C(C10);

--初始化tab_test_Q表数据，先从tab_test_C生成同步40000条数据，剩下10000条数据使用脚本同步过来

DROP TABLE tab_test_Q;

CREATE TABLE tab_test_Q AS SELECT * FROM tab_test_C where rownum < 40001;

create UNIQUE INDEX uid_test_q_1 on tab_test_Q(C10);

-- 验证数据未同步成功 此时记录数差1000

select count(*) from tab_test_Q;

-- 使用merge语法同步tab_test_C的数据到tab_test_Q

DECLARE

    CURSOR cur is select * from tab_test_C;

    type mergeArray_t is table of tab_test_C % ROWTYPE index by BINARY_INTEGER;

    mergeArray mergeArray_t;

BEGIN

    OPEN cur;

    LOOP

        EXIT WHEN cur % NOTFOUND;

        FETCH cur bulk collect into mergeArray LIMIT 16; -- 每次限十几条记录，不要占用太多内存 这个数字调大点效率会更高

        BEGIN

            FORALL rw IN 1 .. mergeArray.count

                MERGE INTO tab_test_Q A

                USING (SELECT mergeArray(rw).C1 C1, mergeArray(rw).C2 C2, mergeArray(rw).C3 C3, mergeArray(rw).C4 C4,

                    mergeArray(rw).C5 C5, mergeArray(rw).C6 C6, mergeArray(rw).C7 C7, mergeArray(rw).C8 C8,

                    mergeArray(rw).C9 C9, mergeArray(rw).C10 C10 FROM DUAL) B

                ON (A.C10 = B.C10)

                WHEN MATCHED THEN

                    UPDATE SET A.C1 = mergeArray(rw).C1, A.C2 = mergeArray(rw).C2, A.C3 = mergeArray(rw).C3,

                        A.C4 = mergeArray(rw).C4, A.C5 = mergeArray(rw).C5,

                        A.C6 = mergeArray(rw).C6, A.C7 = mergeArray(rw).C7, A.C8 = mergeArray(rw).C8,

                        A.C9 = mergeArray(rw).C9

                WHEN NOT MATCHED THEN

                    INSERT (C1, C2, C3, C4, C5, C6, C7, C8, C9, C10) VALUES(mergeArray(rw).C1, mergeArray(rw).C2,

                        mergeArray(rw).C3, mergeArray(rw).C4, mergeArray(rw).C5, mergeArray(rw).C6,

                        mergeArray(rw).C7, mergeArray(rw).C8, mergeArray(rw).C9, mergeArray(rw).C10);

            -- DBMS_OUTPUT.PUT_LINE(mergeArray.count);

        EXCEPTION

            WHEN OTHERS THEN

                    DBMS_OUTPUT.PUT_LINE('error1');

        END;

    END LOOP;

    CLOSE cur;

    COMMIT;

END;

/

--耗时0.04秒

-- 验证数据同步成功

select count(*) from tab_test_Q;

--初始化tab_test_Q表数据，先从tab_test_C生成同步40000条数据，剩下10000条数据使用脚本同步过来

DROP TABLE tab_test_Q;

CREATE TABLE tab_test_Q AS SELECT * FROM tab_test_C where rownum < 40001;

create UNIQUE INDEX uid_test_q_1 on tab_test_Q(C10);

-- 验证数据未同步成功 此时记录数差1000

select count(*) from tab_test_Q;

-- 使用常规语法同步tab_test_C的数据到tab_test_Q

BEGIN

    for cur in (select * from tab_test_C)

    LOOP

        BEGIN

            INSERT INTO tab_test_Q(C1, C2, C3, C4, C5, C6, C7, C8, C9, C10)

            VALUES(cur.C1, cur.C2, cur.C3, cur.C4, cur.C5, cur.C6, cur.C7, cur.C8, cur.C9, cur.C10);

        EXCEPTION

            WHEN DUP_VAL_ON_INDEX THEN --唯一索引冲突时更新

                UPDATE tab_test_Q SET C1 = cur.C1, C2 = cur.C2, C3 = cur.C3, C4 = cur.C4, C5 = cur.C5, C6 = cur.C6, C7 = cur.C7, C8 = cur.C8, C9 = cur.C9

                WHERE C10 = cur.C10;

            WHEN OTHERS THEN

                    DBMS_OUTPUT.PUT_LINE('error1');

        END;

    END LOOP;

    COMMIT;

END;

/

--耗时14.77秒

-- 验证数据同步成功

select count(*) from tab_test_Q;

merge效率的更多相关文章

测试merge效率
测试说明: MERGE是oracle提供的一种特殊的sql语法,非常适用于数据同步场景,即: (把A表数据插到B表,如果B表存在相同主键的记录则使用A表数据对B表进行更新) 数据同步的常规做法是先尝试 ...
mysql学习笔记--数据库视图
一.视图 1. 概念 a. 视图是一张虚拟表,它表示一张表的部分或多张表的综合的结构 b. 视图仅仅是表结构,没有数据.视图的结构和数据建立在表的基础上 2. 创建视图 a. 语法: create [ ...
PLSQL_性能优化系列17_Oracle Merge Into和Update更新效率
2015-05-21 Created By BaoXinjian 一.摘要以前只考虑 merge into 只是在特定场合下方便才使用的,今天才发现,merge into 竟然会比 update 在 ...
Merge into语句用法及其效率问题
Merge into语句用法及其效率问题 /*Merge into 详细介绍MERGE语句用来合并UPDATE和INSERT语句.通过MERGE语句,根据一张表或子查询的连接条件对另外一张表进行查询, ...
merge into 和 update 的效率对比
以前只考虑 merge into 只是在特定场合下方便才使用的,今天才发现,merge into 竟然会比 update 在更新数据时有这么大的改进.其实呢,merge into部分的update和u ...
SQL Tuning 基础概述06 - 表的关联方式：Nested Loops Join，Merge Sort Join & Hash Join
nested loops join(嵌套循环) 驱动表返回几条结果集,被驱动表访问多少次,有驱动顺序,无须排序,无任何限制. 驱动表限制条件有索引,被驱动表连接条件有索引. hints:use_n ...
[LeetCode] Merge k Sorted Lists 合并k个有序链表
Merge k sorted linked lists and return it as one sorted list. Analyze and describe its complexity. 这 ...
No.023：Merge k Sorted Lists
问题: Merge k sorted linked lists and return it as one sorted list. Analyze and describe its complexit ...
No.021：Merge Two Sorted Lists
问题: Merge two sorted linked lists and return it as a new list. The new list should be made by splici ...

随机推荐

计数dp做题笔记
YCJS 3924 饼干 Description 给定一个长度为$n$的序列,序列每个元素的取值为$[1,x]$,现在给定$q$个区间,求在所有取值方案中,区间最小值的最大值的期望是多少? ...
正整数n拆分成几个不同的平方数——DFS&&打表
考虑将正整数n拆分成几个不同的平方数之和,比如30=1^2 + 2^2 + 5^2=1^2 + 2^2 + 3^2 + 4^2,而8不存在这样的拆分. #include<bits/stdc++. ...
MULTIPOLYGON、POLYGON 封装为echart geoJson 数据封装
一.环境.问题简述: 1.采用的事前后端分离,后端需要封装将点位获取的点位信息封装为geoJson数据类型,供前端利用echart 绘制地图: 2.思路:简单理解geoJson,将对应坐标点位封装为g ...
错误调试以及debug的使用
/*定义 .search 搜索*/ $.fn.UiSearch=function(){ var ui=$(this); //任何地方都可以使用断点调试:debugger; //调试时,可以在控制台输入 ...
JavaScript属性名和属性值
㈠属性名 var obj = new Object(); 向对象中添加属性 ⑴属性名: - 对象的属性名不强制要求遵守标识符的规范什么乱七八糟的名 ...
word标题前出现黑块解决方案
1,将光标定位到出现问题的标题前面 2,点击最上方的标题,然后点击修改-->格式-->编号-->无-->确定. 3,重新设置标题即可.
Django基础之cookie
1. Cookie 1.1 Cookie的由来大家都知道HTTP协议是无状态的.无状态的意思是每次请求都是独立的,它的执行情况和结果与前面的请求和之后的请求都无直接关系, 它不会受前面的请求响应情况 ...
LG5283 异或粽子
题意共有$n$个数,选择$k$个不同的$[l,r]$区间,使得它们的异或和最大 $ 1 \leq n \leq 5 \times 10^5,k \leq 2 \times 10^5$ 思 ...
使用Git上传文件至Github
记录一下怎么把文件上传到Github,因为之前都存在本地,没上传过Github,自己以后看起来也有个记忆.因为我自己已经安装好Git和注册好Github账号了,设置好了SSH key.这部分不懂的,就 ...
Ubuntu安装Redis及使用
NoSQL简介NoSQL,全名为Not Only SQL,指的是非关系型的数据库随着访问量的上升,网站的数据库性能出现了问题,于是nosql被设计出来优点/缺点优点:高可扩展性分布式计算低成本架构的 ...

merge效率

测试merge效率

merge效率的更多相关文章

随机推荐

热门专题