ORACLE+PYTHON实战：复制A表数据到B表

最近在学习python ，看到了pythod的oracle，不仅可以一次fetch多条，也可以一次insert多条，想写一个复制A表数据到B表的程序来看看实际效率能不能提高。写完发现，非常惊艳！效率提升了近一倍！当然可能会认为这个没有实际意义，其实不然。

从A表复制数据到B表有很多中方法，一般直接insert即可:

　　insert into tableA select * from tableB ;

但是当数据量非常大时，到达上亿水准的时候，这样做就很郁闷了，因为本身会跑很慢，又看不到进度，偶尔还会被数据库因为回滚段不够而悲剧。

所以，这种时候，我一般是用游标来做的：

declare

  v_num number ;

begin

  v_num:=0 ;

  for v_cur in (select t.prod_inst_id , t.acc_num , t.user_name from cust30.prod_inst t where rownum <50000 ) loop

  insert into test_prod_inst values (v_cur.prod_inst_id , v_cur.acc_num , v_cur.user_name) ;

  v_num:=v_num+1 ;

  if mod(v_num,50000) = 0 then

    commit ;

  end if ;

  end loop ;

end ;

　(也可以用fetch一次多条的方式：bulk 但是实际测试实际快不了多少)。现在的想法就是拿python替代这个，实际代码如下：

#!/home/orashell/python27/bin/python

# -*- coding: utf-8 -*-

import os

import cx_Oracle

#需要设置这个不然插入中文会乱码

os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'

#目的数据库

trans_to_db = cx_Oracle.connect('user/pass#@servicename')

#来源数据库

trans_from_db = cx_Oracle.connect('user/pass#@servicename')

#打开查询游标

curselect = trans_from_db.cursor()

#打开插入游标

curinsert = trans_to_db.cursor()

#根据游标生成插入的语句 需要根据已经打开的游标、目的表名 输出这样的

#insert into test_prod_inst (PROD_INST_ID,ACC_NUM,USER_NAME) values(:1,:2,:3)

#输入 fromcur 为一个已经打开的游标对象

#输入 totable 为目的表名

#输出 returnstr 为生成好的SQL

def getInsertSql( fromcur ,totable ):

    #习惯这样做 :) 先生成一个字符串模板 再替换

    returnstr = 'insert into '+totable+' (SELECTSTR) values(INSERTSTR)'

    # 得到游标的描述 cx_Oracle游标描述 本质为一个元组（见下） 第一列为字段名

    #[('PROD_INST_ID', <type 'cx_Oracle.NUMBER'>, 17, None, 16, 0, 0), ('ACC_NUM', <type 'cx_Oracle.STRING'>, 32, 96, None, None, 0), ('USER_NAME', <type 'cx_Oracle.STRING'>, 250, 750, None, None, 1)]

    curdesc = fromcur.description

    selectstr = ''

    insertstr = ''

    num=0

    #拼好字符串模板的 SELECTSTR 以及 INSERTSTR 部分

    for i in curdesc:

        num=num+1

        selectstr=selectstr+i[0]+','

        insertstr=insertstr+':'+str(num)+','

    #去掉最后一个','

    selectstr=selectstr[0:len(selectstr) - 1]

    insertstr=insertstr[0:len(insertstr) - 1]

    #替换

    returnstr=returnstr.replace('SELECTSTR',selectstr );

    returnstr=returnstr.replace('INSERTSTR',insertstr );

    return  returnstr

#实际执行的函数

def runmain():

    #用一个SQL生成游标

    curselect.execute('select  t.prod_inst_id , t.acc_num , t.user_name  from cust30.prod_inst t where rownum<10000 ')

    #得到插入游标的

    manyinserstr=getInsertSql(curselect, 'test_prod_inst')

    #插入游标 prepare

    curinsert.prepare(manyinserstr)

    while True:

        #fetch cx_Oracle fetch 当fetch 一条的时候 得到的是一行数据的元组 但是如果是多行 得到的是一个list

        #所以 fetchone的结果不转换 不能使用executemany

        x=curselect.fetchmany(5000)

        #插入

        curinsert.executemany(None, x)

        #提交

        trans_to_db.commit()

        #判断退出

        if len(x)==0:

            break

#执行

if __name__ == '__main__':

    runmain()

    trans_from_db.close

    trans_to_db.close

本以为用这个会慢一些，因为实际上，这批数据库是过了网络的（数据-本机-数据库），而使用PLSQL是没有使用网络。但是用这个插了5000万数据，结果却不是这样，用了64秒，而用前文的第一种方式用了113秒，差不多是一倍的效率，这还是一个数据库两个表的复制，如果是两个数据库，跨dblink会更加明显。

原因我猜测是这么两个：

A：在实际insert的时候，cx_Oralce拆成了多个线程去处理。如果考虑实际在特别大数据量的时候，plsql这边也可以分为多个模处理，效率最终可能会卡在IO上。

B：oracle的内存管理更加复杂，会比python这种相当于手动管理的方式，消耗的资源会更多。

期待大神能够解惑。

ORACLE+PYTHON实战：复制A表数据到B表的更多相关文章

MySQL用sql复制表数据到新表的方法
用sqlyog无法直接复制出一个不同表名的表来,只能copy到其他库上同名的表. 在MySQL数据库中,应该如何用sql将表数据复制到新表中呢? 本人通过试验测试成功了,而且相当简单易懂,速度也非常快 ...
MySQL的奇怪的删表数据文件而表照样能打开
MySQL的奇怪的删表数据文件而表照样能打开 author:headsen chen 2017-11-02 17:57:17 现象:删除一个正在运行的mysql数据库的表的数据文件:* ...
mysql复制表数据，多表数据复制到一张表
对于mysql 复制表数据可以使用 insert into select 方式示例: $sql="insert into icarzoo.provider(providerId,provi ...
oracle xmltype导入并解析Excel数据 (一)创建表与序
表说明: T_EXCEL_IMPORT_DATASRC: Excel数据存储表,(使用了xmltype存储Excel数据) 部分字段说明: BUSINESSTYPE: Excel模板类型,一个Exce ...
ABAP 动态备份自建表数据到新表（自建表有数据的情况下要改字段长度或者其他）
当abaper开发好一个程序给用户使用一段时间后,发现某个字段的长度需要修改,但数据库表中已经存在很多数据,冒然直接改表字段可能会导致数据丢失,这种问题的后果可能非常严重. 所以我想到先复制出一个新表 ...
Excel表数据导入数据库表中
***Excel表数据导入到数据库表中通过数据库表的模板做成‘Excel’表的数据导入到数据库相应的表中(注意:主表和从表的关系,要先导‘主表’在导入从表) 过程:通过数据库的导入工具—先导入为 ...
sqlserver数据库导出表结构和表数据生成创建表和insert语句
问题描述: 有时候我们只需要导出一张表和表数据到另外一个数据库,如果是备份整个库的话,就会很麻烦那样,没法满足需求. 解决方法: 以sqlserver2014为例:把MGActivity数据库的bat ...
hive-hbase-handler方式导入hive表数据到hbase表中
Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive-hbase-handler.jar工具类 : hive-hbase-handler.jar在 ...
sqlserver 清除表数据和拷贝表结构的操作
最近在做一个ERP系统需要导入数据,因此用到了sql的一些操作,在这里记录一下. 1.清除表数据: Delete from 表名称 where XXX 2.拷贝表结构,需求是新增一个和某个表数据格式一 ...

随机推荐

For循环的实质
For循环的实质 1.调用可迭代对象的iter方法返回一个迭代器对象 2.不断调用迭代器对象的next方法 3.处理StopIteration
实现一个单隐层神经网络python
看过首席科学家NG的深度学习公开课很久了,一直没有时间做课后编程题,做完想把思路总结下来,仅仅记录编程主线. 一引用工具包 import numpy as np import matplotlib. ...
python函数说明内容格式错误
def levlTwo(levloneList,levlOneNum): """ 入参levloneList 一级城市列表入参levlOneNum 用户选择的城市序号 ...
jvm - 垃圾回收
jvm - 垃圾回收注意 : 本系列文章为学习系列,部分内容会取自相关书籍或者网络资源,在文章中间和末尾处会有标注垃圾回收的意义它使得java程序员不再时时刻刻的关注内存管理方面的工作. 垃圾回 ...
bug：页面交互操作引发的问题
最近在测试一些h5页面,突然悟到一些测试点需求点: 用户可以在页面领取礼物,领取的礼物在页面底部展示,用户点击礼物可调起分享弹窗,礼物超过一屏可左右滑动, bug的表现形式: 仅当礼物超过一屏时(一 ...
暑假练习赛 006 B Bear and Prime 100
Bear and Prime 100Crawling in process... Crawling failed Time Limit:1000MS Memory Limit:262144KB ...
ELK 完整部署和使用 - 每天5分钟玩转 Docker 容器技术（90）
上一节已经部署了容器化的 ELK,本节讨论如何将日志导入 ELK 并进行图形化展示. 几乎所有的软件和应用都有自己的日志文件,容器也不例外.前面我们已经知道 Docker 会将容器日志记录到 /var ...
Log4j 2翻译 Garbage-free Steady State Logging（稳定的以不会生成垃圾的状态来记录日志）
本人菜鸟,在学习Log4j 2 的时候做的一些笔记---对"官方网站"的翻译,部分内容自己也不懂,希望大家指点 Garbage collection pauses are a co ...
log4donet 的一篇简单使用实例
背景最近在写一个Adapter,需要调用别的程序的DLL. Adapter使用的是C#还有.net的等方面的技术.今天在写log这块,就像尝试一下有没有“轮子”可以试试的.在网上搜罗了一番之后,决定 ...
基于.net的通用内存缓存模型组件
谈到缓存,我们自然而然就会想到缓存的好处,比如: 降低高并发数据读取的系统压力:静态数据访问.动态数据访问存储预处理数据,提升系统响应速度和TPS 降低高并发数据写入的系统压力提升系统可用性,后台 ...

ORACLE+PYTHON实战：复制A表数据到B表

ORACLE+PYTHON实战：复制A表数据到B表的更多相关文章

随机推荐

热门专题