oracle基于3种方法的大数据量插入更新

过程插入更新的3种方法：

a、逐条检查插入或更新，同时执行插入或更新

b、逐条merge into（逐条是为了记录过程日志与错误信息）

c、基于关联数组的检查插入、更新，通过forall批量sql执行

以下为模拟步骤：

1、创建模拟大表，数据量1亿不分区

create table big_table as

SELECT ROWNUM RN,'A' A,'B' B,'C' C,'D' D FROM

      ( SELECT ROWNUM RN FROM DUAL CONNECT BY ROWNUM <= 1000) T1，

      ( SELECT ROWNUM RN FROM DUAL CONNECT BY ROWNUM <= 1000) T2，

      ( SELECT ROWNUM RN FROM DUAL CONNECT BY ROWNUM <= 100) T3;

说明：用connect by方法创建测试大表相对较快

2、给大表加上一个主键，因为插入更新基于主键

 alter table BIG_TABLE2

  add constraint PK_RN2 primary key (RN)

3、创建模拟的更新表，数据量20万

CREATE TABLE UP_TABLE ( RN NUMBER,A VARCHAR2(20),B VARCHAR2(20),C VARCHAR2(20),D VARCHAR2(20))

4、给更新表加数据，10万更新，10万插入，写的相对烦人些。。。代码不贴出来了

5、日志表结构

6、第一种方法的过程如下：

create or replace procedure sp_ins_up is

  v_bz    char(1);--插入更新标志

  v_stime pls_integer;--过程起始时间

  i       pls_integer := 0; --执行数量

  v_up    pls_integer := 0;--更新数量

  v_ins   pls_integer := 0;--插入数量

  v_time  pls_integer;--循环当前循环起始时间

begin

  v_stime := dbms_utility.get_time();--过程起始时间

  v_time  := dbms_utility.get_time();--当前循环起始时间

  for rec in (select * from up_table) loop--开始循环

    i := i + 1;

    begin--当前数据执行插入更行判断

      select '' into v_bz from big_table1 a where a.rn = rec.rn;

    exception

      when no_data_found then

        v_bz := 0;

    end;

    if v_bz = 1 then--更新

      v_up := v_up + 1;

      update big_table1 a

         set a.a = rec.a, a.b = rec.b, a.c = rec.c, a.d = rec.d

         where a.rn = rec.rn;

    else--插入

      v_ins := v_ins + 1;

      insert into big_table1 values (rec.rn, rec.a, rec.b, rec.c, rec.d);

    end if;

    if mod(i, 5000) = 0 then--一定数量提交

      insert into INS_UP_LOG

      values

        ('sp_ins_up',

         round((dbms_utility.get_time - v_time) / 100, 2),

         v_up + v_ins,

         v_up,

         v_ins);

      commit;

      v_up   := 0;

      v_ins  := 0;

      v_time := dbms_utility.get_time;

    end if;

  end loop;

  commit;

  insert into ins_up_log--过程总时间记录

  values

    ('sp_ins_up',

     round((dbms_utility.get_time - v_stime) / 100, 2),

     '',

     '',

     '');

  commit;

end sp_ins_up;

7、merge into方法过程如下：

create or replace procedure sp_merge is

  v_stime  pls_integer; --过程起始时间

  i        pls_integer := 0; --执行数量

  v_time   pls_integer; --循环当前循环起始时间

  v_rn     up_table.rn%type; --缓存值

  v_errmsg varchar2(500); --当前错误信息

begin

  v_stime := dbms_utility.get_time();

  v_time  := dbms_utility.get_time();

  for rec in (select * from up_table) loop

    i    := i + 1;

    v_rn := rec.rn; --缓存当前主键

    merge into big_table3 t --merge into

    using (select * from up_table where rn = rec.rn) a

    on (t.rn = a.rn)

    when matched then

      update set t.a = a.a, t.b = a.b, t.c = a.c, t.d = a.d

    when not matched then

      insert values (a.rn, a.a, a.b, a.c, a.d);

    v_errmsg := sqlerrm;

    if mod(i, 5000) = 0 then

      insert into ins_up_log

      values

        ('sp_merge',

         round((dbms_utility.get_time - v_time) / 100, 2),

         i,

         i / 2, --此处插入数量不必在意

         i / 2);

      commit;

      v_time := dbms_utility.get_time();

    end if;

  end loop;

  insert into ins_up_log --过程总时间记录

  values

    ('sp_merge',

     round((dbms_utility.get_time - v_stime) / 100, 2),

     i,

     '',

     '');

  commit;

exception

  when others then

    insert into ins_up_err values ('sp_merge', v_rn, v_errmsg);

end sp_merge;

8、forall方法，结合第一种方法的判断方式：

create or replace procedure sp_forall_new is

  type table_type is table of up_table%rowtype index by pls_integer; --增量表缓存

  tab_all table_type; --增量表全

  tab_up  table_type; --增量表-更新

  tab_ins table_type; --增量表-插入

  v_bz    char(1); --存在标志

  cursor cur_up is

    select * from up_table; --更新表游标

  v_stime   pls_integer; --过程开始时间

  v_time    pls_integer; --每次循环开始时间

  v_num_ins pls_integer := 0; --每次循环插入数量

  v_num_up  pls_integer := 0; --每次循环更新数量

  v_num     number; --数量缓存值

  v_err_msg number; --forall中错误信息

begin

  v_stime := dbms_utility.get_time(); --过程开始

  open cur_up; --打开游标

  loop

    --开始循环游标

    v_time    := dbms_utility.get_time(); --当前循环开始时间

    v_num_ins := 0; --每次循环置零

    v_num_up  := 0; --每次循环置零

    fetch cur_up bulk collect

      into tab_all limit 5000; --批量插入缓存表，每次限定5000条

    exit when tab_all.count = 0; --当缓存表中无数据，退出循环

    --

    for i in 1 .. tab_all.count loop

      --此循环功能：判断是否存在目标表中

      begin

        select '' into v_bz from big_table2 t where t.rn = tab_all(i).rn; --存在

      exception

        when no_data_found then

          v_bz := ''; --不存在

      end;

      --

      if v_bz = '' then

        --存在

        v_num_up := v_num_up + 1; --更新数值+1

        tab_up(v_num_up) := tab_all(i); --复制到更新缓存表

      else

        --不存在

        v_num_ins := v_num_ins + 1; --插入数值+1

        tab_ins(v_num_ins) := tab_all(i); --复制到插入缓存表

      end if;

      --

    end loop;

    --

    --批量SQL，且在批量执行中错误的信息记录在sql%bulk_exceptions缓存表中

    if tab_up.count <> 0 then

      forall i in tab_up.first .. tab_up.last save exceptions

        update big_table2 t

           set t.a = tab_up(i).a,

               t.b = tab_up(i).b,

               t.c = tab_up(i).c,

               t.d = tab_up(i).d

         where t.rn = tab_up(i).rn;

      for i in 1 .. sql%bulk_exceptions.count loop

        v_num     := sql%bulk_exceptions(i).error_index;

        v_err_msg := sqlerrm(-sql%bulk_exceptions(i).error_code);

        insert into ins_up_err

        values

          ('sp_forall', tab_up(v_num).rn, v_err_msg);

      end loop;

      commit;

    end if; --更新批量结束

    --批量SQL，且在批量执行中错误的信息记录在sql%bulk_exceptions缓存表中

    if tab_ins.count <> 0 then

      forall i in tab_ins.first .. tab_ins.last save exceptions

        insert into big_table2

        values

          (tab_ins(i).rn,

           tab_ins(i).a,

           tab_ins(i).b,

           tab_ins(i).c,

           tab_ins(i).d);

      for i in 1 .. sql%bulk_exceptions.count loop

        v_num     := sql%bulk_exceptions(i).error_index;

        v_err_msg := sqlerrm(-sql%bulk_exceptions(i).error_code);

        insert into ins_up_err

        values

          ('sp_forall', tab_ins(v_num).rn, v_err_msg);

      end loop;

      commit;

    end if; --插入批量结束

    insert into ins_up_log --记录日志

    values

      ('sp_forall',

       round((dbms_utility.get_time - v_time) / 100, 2),

       5000,

       v_num_up,

       v_num_ins);

    commit;

    --清空当前循环插入、更新缓存表数据（不清空，下次循环重复执行）

    tab_up.delete;

    tab_ins.delete;

  end loop;

  close cur_up; --关闭游标

  insert into ins_up_log --过程总时间记录

  values

    ('sp_forall',

     round((dbms_utility.get_time - v_stime) / 100, 2),

     '',

     '',

     '');

  commit;

end sp_forall_new;

最后结果：同样对一亿的表插入更新20万条数据,多次执行平均时间

sp_merge 14.48秒
sp_forall 6.63秒
sp_ins_up 44.33秒

从每5000条提交一次的时间可以得出来，forall最稳定，其次merge稍有起伏，手动执行插入更新浮动最大从0.3秒到6.9秒不等。

效率方面：forall优势明显，其次merge也不差，手动插入更新最慢且不稳定

代码方面：merge into与手动插入更新相对简洁，forall就比较复杂

扩展性：手动插入更新可以加上许多业务性功能，forall方式目前oracle也提供了相当多的函数用于数据处理，所以次之，merge into就个人而言，相对笨重一些了。

oracle基于3种方法的大数据量插入更新的更多相关文章

c#几种数据库的大数据批量插入（SqlServer、Oracle、SQLite和MySql）
这篇文章主要介绍了c#几种数据库的大数据批量插入(SqlServer.Oracle.SQLite和MySql),需要的朋友可以了解一下. 在之前只知道SqlServer支持数据批量插入,殊不知道Ora ...
mysql/oracle jdbc大数据量插入优化
10.10.6 大数据量插入优化在很多涉及支付和金融相关的系统中,夜间会进行批处理,在批处理的一开始或最后一般需要将数据回库,因为应用和数据库通常部署在不同的服务器,而且应用所在的服务器一般也不会 ...
C# & SQL Server大数据量插入方式对比
以下内容大部分来自: http://blog.csdn.net/tjvictor/article/details/4360030 部分内容出自互联网,实验结果为亲测. 最近自己开发一个向数据库中插入大 ...
C#中几种数据库的大数据批量插入
C#语言中对SqlServer.Oracle.SQLite和MySql中的数据批量插入是支持的,不过Oracle需要使用Orace.DataAccess驱动. IProvider里有一个用于实现批量插 ...
sql server 2005 大数据量插入性能对比
sql server 2005大数据量的插入操作第一,写个存储过程,传入参数,存储过程里面是insert操作, 第二,用System.Data.SqlClient.SqlBulkCopy实例方法, ...
使用rowid抽取数据方法以及大数据量游标卡住的应对
平时工作的时候,经常会遇到这种事情,从一个大表A中,抽取字段a在一个相对较小B的表的数据,比如,从一个详单表中,抽取几万个用户号码的话单出来.这种时候,一般来说, 做关联查询: create tabl ...
C#:几种数据库的大数据批量插入
在之前只知道SqlServer支持数据批量插入,殊不知道Oracle.SQLite和MySql也是支持的,不过Oracle需要使用Orace.DataAccess驱动,今天就贴出几种数据库的批量插入解 ...
C#:几种数据库的大数据批量插入(转)
在之前只知道SqlServer支持数据批量插入,殊不知道Oracle.SQLite和MySql也是支持的,不过Oracle需要使用Orace.DataAccess驱动,今天就贴出几种数据库的批量插入解 ...
C#:几种数据库的大数据批量插入 - faib
在之前只知道SqlServer支持数据批量插入,殊不知道Oracle.SQLite和MySql也是支持的,不过Oracle需要使用Orace.DataAccess驱动,今天就贴出几种数据库的批量插入解 ...

随机推荐

javascript在字符串中提取网址并替换成超链接
var str = " http://wasmip.baidu.com.cn/mip/km/archives/km_archives_main/kmArchivesMain.do?metho ...
JBPM4.4_执行流程实例
1. 执行流程实例 1.1. 启动流程实例说明:流程实例创建后,直接就到开始活动后的第一个活动,不会在开始活动停留. 1.1.1. 示例代码1:使用指定key的最新版本的流程定义启动流程实例 Pro ...
Redis（六）-- SpringMVC整合Redis
一.pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www ...
cocos2d-x游戏引擎核心之四——动作调度机制
一.动作机制的用法在深入学习动作机制在 Cocos2d-x 里是如何实现的之前,我们先来学习整套动作机制的用法,先知道怎么用,再深入学习它如何实现,是一个很好很重要的学习方法. (1)基本概念 CC ...
diff命令的参数详解和实例
diff命令参数: diff - 找出两个文件的不同点总览 diff [选项] 源文件目标文件描述在最简单的情况是, diff 比较两个文件的内容 (源文件和目标文件). 文件名可以是 - ...
poj_3579 二分法
题目大意给定N个数,这些数字两两求差构成C(N,2)(即N*(N-1)/2)个数值,求这C(N,2)个数的中位数.N <= 100000. 题目分析根据数据规模N最大为100000,可知不能 ...
poj_1204 Trie图
题目大意给出一个RxC的字符组成的puzzle,中间可以从左向右,从右到左,从上到下,从下到上,从左上到右下,从右下到左上,从左下到右上,从右上到左下,八个方向进行查找字符串. 给出M个字符 ...
poj_1151 线段树
题目大意在平面上给定n个矩形,可以相互覆盖全部或者部分,求出矩形占据的总面积. 题目分析将矩形按照x方向的进行分割之后,将平面沿着y方向划分一系列单元(不定高度),每个矩形在y方向上占据若干连续的 ...
Ajax轮询——定时的通过Ajax查询服务端
概念:轮询(polling):客户端按规定时间定时向服务端发送ajax请求,服务器接到请求后马上返回响应信息并关闭连接. test.html //前端代码 <html> <h ...
(1.1.6)UVA 10978 Let's Play Magic!(直叙式模拟)
/* * UVA_10978.CPP * * Created on: 2013年10月6日 * Author: Administrator */ #include <iostream> # ...

oracle基于3种方法的大数据量插入更新

oracle基于3种方法的大数据量插入更新的更多相关文章

随机推荐

热门专题