验证Oracle处理速度

（这是2009年写的东西了，在网上看到有人对数据库批量操作的‘速度’比较关注，于是就把这篇老文章整理了一下）

一、环境及前提

在244上（一台稍好一些的机器，做了RAID，机械硬盘，Raid几忘了），对eprk_person_flow表进行复制、更新，验证在Oracle数据库中操纵数据的各种方法的速度。共35,629,784条记录。

二、复制：直接建表

create /*+parallel*/table tt1 as select /*+parallel(pf, 4)*/ * from eprk_person_flow pf;

结果：
第一次：126.297秒，约每秒写入28.2W条数据。
第二次：149.109秒，约每秒写入23.9W条数据。

drop table tt1 purge;

三、复制：使用BULK COLLECT批量处理

create table tt1 as select * from eprk_person_flow where 1 = 2;

--   以下代码还有一个可以参考的地方：没有根据表结构声明太多的类型及变量。

declare

cursor cur_temp is

select /*+parallel(pf, 4)*/* from eprk_person_flow pf;

type t_person_flow is tableof cur_temp%rowtype;   -- 注意：这句很关键，直接引用上面的游标来定义类型

v_person_flow t_person_flow; begin

open cur_temp;

loop

fetch cur_temp  bulk collect into v_person_flow

limit 1000;

forall i in 1..v_person_flow.last

insert /*+append nologging*/ into tt1 values v_person_flow(i);-- 注意：这里values后没有扩号

exit when cur_temp%notfound; end loop;

closecur_temp; end;

drop tablett1;

结果：

第一次：768.828秒。约每秒写入4.6W条数。

第二次：505.953秒。约每秒写入7.0W条数据。(加hint，把limit从200改为1000)如果在目标表上建立索引后再插入，哪怕只建立一个主键约束，耗时也将*2还多。

在复制数据时，DDL对比DML语句，在速度上还有很有优势的。

四、更新

直接更新10%、20%、50%、100%的数据。

/*

建表并建立索引

*/

create /*+parallel*/table tt1 as select /*+parallel(pf, 4)*/ * from eprk_person_flow pf; -- 147s

alter table tt1

add constraint PK_tt1_PERSON_FLOW  primary key (SERIAL_NUMBER) using index

tablespace NNC_INDEX01 pctfree 10

initrans 2

maxtrans 255 storage

(

initial 64M minextents 1

maxextents  unlimited

);-- 102s

create index I_TT1_PERSON_FLOW_TT   on TT1 (PK_PERSON_ACCOUNT,   PK_TRADETYPE)

tablespace NNC_INDEX01 pctfree 10

initrans 2

maxtrans 255 storage

(

initial 128M

minextents 1

maxextents unlimited

);-- 200s

create index I_TT1_PERSON_FLOW_VN   on TT1 (VOUCHER_NUMBER) tablespace NNC_INDEX01

pctfree 10 initrans 2

maxtrans 255

storage (

initial 128M minextents 1

maxextents unlimited

);-- 88s

-- 更新数据(10%)

declare

i integer;

-- 从tt1表中，取10%的数据

cursor cur_temp is

select serial_number from tt1

where rownum < cast((35629784 / 10) as integer);

type t_serial_number is tableof tt1.serial_number%type index by pls_integer; v_serial_number t_serial_number;

begin

open cur_temp;

loop

fetch cur_temp  bulk collect into v_serial_number limit 1000;

forall i in 1..v_serial_number.count update /*+nologging*/ tt1

set occur_cash = 1, occur_unit = 1, cash_balance=1 , balance= 1 where serial_number = v_serial_number(i);

exit when cur_temp%notfound;

end loop;

closecur_temp; end;

更新10%的数据，共更新356W数据，耗时86.515秒，平均约每秒更新4.1W条。
更新20%的数据，共更新712W数据，耗时161.485秒，平均约每秒更新4 .4W条。
更新50%的数据，共更新1781W数据，耗时427.766秒，平均约每秒更新4.1W条。
更新100%的数据，共更新3562W数据，耗时1118.063秒，平均约每秒更新3.2W条。

在更新过程中，游标只读取1个字段，更新4个字段，由于该表有3个索引，虽然更新的字段都不在索引上，发现写入的数据量是读取的数据量的20倍以上。（数据库归档日志打开）
以上只测试单表，并且顺序读取数据，然后根据唯一索引进行更新，如果有多表关联等要求，情况会更复杂。所以实际过程中，速度应该达不到4W/秒。

drop table tt1;

五、更新：使用中间表进行更新，并通过判断更新的数据量，进行对应的DDL操作。

-- 更新10%的数据。

-- 建立临时表

create global temporary table temp_tt1  as select * from tt1 where 1 = 2; -- 0.2s

-- 插入数据

insert into temp_tt1

select * from tt1

where rownum < cast((35629784 / 10) as integer);-- 12s

-- 更新临时表中的数据

update /*+parallel(temp_tt1, 4) nologging */ temp_tt1

set occur_cash = 1, occur_unit = 1, cash_balance=1 , balance= 1;-- 60s

分支一：

-- 删除源表中的数据

delete from tt1 t1 where exists (select 1 from temp_tt1  temp1 where t1.serial_number = temp1.serial_number);-- 163s

-- 把临时表中的数据插入到源表中

insert /*+parallel(tt1, 4)*/ into tt1 select /*+parallel(temp_tt1, 4)*/* from temp_tt1;--240s

分支二：

-- 使用临时表数据更新目标表

update tt1 t1 set (occur_cash, occur_unit, cash_balance, balance)

= (

select occur_cash, occur_unit, cash_balance, balance from temp_tt1  temp

where t1.serial_number = temp.serial_number

)

where exists ( select 1

from temp_tt1  temp

where t1.serial_number = temp.serial_number

);-- 约30分钟未完成，取消。

用上述方式更新时，硬盘IO没有规律，与其他方式相比，大部分时间都几乎“没有”IO，极慢。

-- 改为以下方式：

update /*+parallel(t1, 4) nologging*/  tt1 t1 set (occur_cash, occur_unit, cash_balance, balance)

= (

select /*+parallel(temp, 4)*/occur_cash, occur_unit, cash_balance, balance

from temp_tt1  temp

where t1.serial_number = temp.serial_number

)

where exists (

select /*+parallel(temp, 4)*/1

from temp_tt1  temp

where t1.serial_number = temp.serial_number

);-- 无效果，用大表（即使是临时表，本例有365W数据）更新更大的表时，直接用SQL实现在性能上是无法接受的。

commit;

drop table temp_tt1;

六、由此想到的：

create table XXX as select .. from ...比插入要快，由此，系统中的临时表如果用create替代insert的话，速度应该有提高。

数据对象的存储及使用设计，应严格根据实际的业务场景来定义，在建立诸如个人流水表之类的大表前，必须对表类型、各种存储结构及参数、是否及如何分区、索引的数量及字段（应根据实际查询要求建立索引）等进行详细的分析。

sql处理的速度还是有上限的，受制于应用环境。

另外，大数据量的处理，还是要考虑拆分为小任务、小事务进行。否则即使数据库有那么大的回滚段，一但后续出错，回滚的时间也等不起，给系统造成的压力也耗不起。

进行上述测试验证，只是好奇而已。

验证Oracle处理速度的更多相关文章

触发器 'SA.U_USER_INFO_TRG' 无效且未通过重新验证--Oracle序列
程序开发时报错:触发器 'SA.U_USER_INFO_TRG' 无效且未通过重新验证打开触发器的定义,执行其中的语句,发现序列 U_USER_INFO_SEQ 未定义.什么是序列呢?序列相当于sql ...
验证Oracle收集统计信息参数granularity数据分析的力度
最近在学习Oracle的统计信息这一块,收集统计信息的方法如下: DBMS_STATS.GATHER_TABLE_STATS ( ownname VARCHAR2, ---所有者名字 tabname ...
Raid信息丢失数据恢复及oracle数据库恢复验证方案
早些时候,有个客户14块盘的磁盘阵列出现故障,需要恢复的数据是oracle数据库,客户在寻求数据恢复技术支持,要求我提供详细的数据恢复方案,以下是提供给客户的详细数据恢复解决方案,本方案包含Raid数 ...
oracle dump数据库
最近正在看老白的<DBA的思想天空>,了解数据块结构,想通过dump data block验证oracle对于行尾的NULL,是不占用存储空间的. 我们先来看一下怎样dump数据块: 1. ...
PL/SQL Developer连接本地Oracle 11g 64位数据库
转摘:http://www.cnblogs.com/ymj126/p/3712727.html 用于学习,笔记,以备后用. 1.登录PL/SQL Developer 这里省略Oracle数据库和PL/ ...
如何查看Oracle客户端版本
在实际工作中,总会遇到一些需要查看.验证ORACLE客户端版本的问题,因为一台服务器可能装了多个Oracle客户端版本:也有可能你需要知道安装的版本是32位还是64位的.如何查看Oracle客户端(O ...
安装oracle
1.安装vnc yum install tigervnc tigervnc-server 2.vncserver启动 3.安装依赖库 yum install -y compat-libstdc* ...
PL/SQL Developer连接本地64位Oracle数据库
1.安装oracle Clinet 首先到Oracle官网上去下载一个Oracle 11g Client(我的是11g的oracle),不过需要先申请一个Oracle 帐号,才能下载. 目前下载地址: ...
pl/sql developer 连接本地ORACLE 11g 64位数据库
1.登录PL/SQL Developer 这里省略Oracle数据库和PL/SQL Developer的安装步骤,注意在安装PL/SQL Developer软件时,不要安装在Program Files ...

随机推荐

实例讲解js正则表达式的使用
前言:正则表达式(regular expression)反反复复学了多次,学了又忘,忘了又学,这次打算把基本的东西都整理出来,加强记忆,也方便下次查询. 学习正则表达式之前首先需要掌握记忆这些基本概念 ...
Linux入门之常用命令（4）vi编辑器
vi分为三种模式一般模式:删除字符.删除整行.复制粘贴等操作编辑模式:i o a r进入输入字符 Esc退出命令行模式::或/ 将光标移动到最末行搜寻数据读取或替换退出vi 显示行号 ...
21.Linux-写USB键盘驱动(详解)
本节目的: 根据上节写的USB鼠标驱动,来依葫芦画瓢写出键盘驱动 1.首先我们通过上节的代码中修改,来打印下键盘驱动的数据到底是怎样的先来回忆下,我们之前写的鼠标驱动的id_table是这样: 所以 ...
vue.js用法和特性详解
前言最近用Vue.js做了一个数据查询平台,还做了一个拼图游戏,突然深深的感到了vue的强大. Vue.js是一套构建用户界面(user interface)的渐进式框架.与其他重量级框架不 ...
UltraEdit中使用正则表达式替换
UltraEdit在使用正则表达式进行查找替换时有两个可使用的语法集合.一个是 UltraEdit 的更早的版本被使用的原来的 UltraEdit 句法.另一个是"Unix"类型的 ...
JavaScript实现模糊推荐的input框(类似百度搜索框)
如何用JS实现一个类似百度搜索框的输入框呢,再填充完失去焦点时,自动填充配置项,最终效果如下图: 实现很简单,但是易用性会上升一大截,需要用到的有jquery-ui的autocomplete,jque ...
RobotFramework自动化测试框架-移动手机自动化测试Click Element At Coordinates关键字的使用
Click Element At Coordinates关键字通过一个具体的坐标点,来模拟点击一个Element,该关键字接收两个参数[ coordinate_X | coordinate_Y ]. ...
C#仪器数据文件解析-Word文件（doc、docx）
不少仪器数据报告输出为Word格式文件,同Excel文件,Word文件doc和docx的存储格式是不同的,相应的解析Word文件的方式也类似,主要有以下方式: 1.通过MS Word应用程序的DCOM ...
ASP.NET没有魔法——ASP.NET MVC是如何运行的？它的生命周期是什么？
前面的文章我们使用ASP.NET MVC创建了个博客应用,那么它是如何工作的呢?我们都知道ASP.NET的程序需要部署到IIS上才能够通过浏览器来访问,那么IIS与ASP.NET MVC程序之间又是如 ...
DOM2练习
左右互相输入 <!DOCTYPE html><html> <head> <meta charset="UTF-8"&g ...

验证Oracle处理速度

验证Oracle处理速度的更多相关文章

随机推荐

热门专题