[转帖]oracle导出千万级数据为csv格式
当数据量小时(20万行内),plsqldev、sqlplus的spool都能比较方便进行csv导出,但是当数据量到百万千万级,这两个方法非常慢而且可能中途客户端就崩溃,需要使用其他方法。
一、 sqluldr2工具
1. 优缺点
- 优点:高效;支持功能较多;用户只需有对应表查询权限;可以在从库执行
- 缺点:目前已没有再维护,只能找到基于oracle 10.2的版本(高版本目前还可以用);密码必须要跟在用户名后面输,安全性不足
2. 下载安装
- 百度云链接:https://pan.baidu.com/s/1V8eqyyYsbJqQSD-Sn-RQGg 提取码:6mdn
下载完后并解压会生成4个文件
- sqluldr2.exe 用于32位windows平台
- sqluldr264.exe 用于64位windows平台
- sqluldr2_linux32_10204.bin 用于linux32位操作系统
- sqluldr2_linux64_10204.bin 用于linux64位操作系统
Windows的可以直接用,Linux的需要加执行权限。
chmod +x sqluldr2_linux64_10204.bin

3. 导出csv格式数据
/data/bak目录需要预先建好,oracle用户可写。如果查询语句较复杂,可以建成一个临时视图,通过视图导出,避免写一堆语句。
./sqluldr2_linux64_10204.bin myuser/xxxxxxx query="select * from tmp1201_all_v" head=yes file=/data/bak/tmp1201_all_v.csv
测试700万左右数据导出约12分钟(15:47开始执行),主要是视图查询较慢,导出表应该更快。

二、 利用存储过程
1. 优缺点
- 优点:效率较高;原生sql、目前无版本问题;可自行增加需要功能
- 缺点:需要sys权限;只能在主库执行;功能相对较少
2. sys用户建存储过程
代码转载自 https://blog.csdn.net/lxp90/article/details/80926236
-
CREATE OR REPLACE PROCEDURE SQL_TO_CSV
-
(
-
P_QUERY IN VARCHAR2, -- PLSQL文
-
P_DIR IN VARCHAR2, -- 导出的文件放置目录
-
P_FILENAME IN VARCHAR2 -- CSV名
-
)
-
IS
-
L_OUTPUT UTL_FILE.FILE_TYPE;
-
L_THECURSOR INTEGER DEFAULT DBMS_SQL.OPEN_CURSOR;
-
L_COLUMNVALUE VARCHAR2(4000);
-
L_STATUS INTEGER;
-
L_COLCNT NUMBER := 0;
-
L_SEPARATOR VARCHAR2(1);
-
L_DESCTBL DBMS_SQL.DESC_TAB;
-
P_MAX_LINESIZE NUMBER := 32000;
-
BEGIN
-
--OPEN FILE
-
L_OUTPUT := UTL_FILE.FOPEN(P_DIR, P_FILENAME, 'W', P_MAX_LINESIZE);
-
--DEFINE DATE FORMAT
-
EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_DATE_FORMAT=''YYYY-MM-DD HH24:MI:SS''';
-
--OPEN CURSOR
-
DBMS_SQL.PARSE(L_THECURSOR, P_QUERY, DBMS_SQL.NATIVE);
-
DBMS_SQL.DESCRIBE_COLUMNS(L_THECURSOR, L_COLCNT, L_DESCTBL);
-
--DUMP TABLE COLUMN NAME
-
FOR I IN 1 .. L_COLCNT LOOP
-
UTL_FILE.PUT(L_OUTPUT,L_SEPARATOR || '"' || L_DESCTBL(I).COL_NAME || '"'); --输出表字段
-
DBMS_SQL.DEFINE_COLUMN(L_THECURSOR, I, L_COLUMNVALUE, 4000);
-
L_SEPARATOR := ',';
-
END LOOP;
-
UTL_FILE.NEW_LINE(L_OUTPUT); --输出表字段
-
--EXECUTE THE QUERY STATEMENT
-
L_STATUS := DBMS_SQL.EXECUTE(L_THECURSOR);
-
-
--DUMP TABLE COLUMN VALUE
-
WHILE (DBMS_SQL.FETCH_ROWS(L_THECURSOR) > 0) LOOP
-
L_SEPARATOR := '';
-
FOR I IN 1 .. L_COLCNT LOOP
-
DBMS_SQL.COLUMN_VALUE(L_THECURSOR, I, L_COLUMNVALUE);
-
UTL_FILE.PUT(L_OUTPUT,
-
L_SEPARATOR || '"' ||
-
TRIM(BOTH ' ' FROM REPLACE(L_COLUMNVALUE, '"', '""')) || '"');
-
L_SEPARATOR := ',';
-
END LOOP;
-
UTL_FILE.NEW_LINE(L_OUTPUT);
-
END LOOP;
-
--CLOSE CURSOR
-
DBMS_SQL.CLOSE_CURSOR(L_THECURSOR);
-
--CLOSE FILE
-
UTL_FILE.FCLOSE(L_OUTPUT);
-
EXCEPTION
-
WHEN OTHERS THEN
-
RAISE;
-
END;
-
/
3. 创建导出目录
/data/bak目录需要预先建好,oracle用户可写。如果查询语句较复杂,可以建成一个临时视图(sys用户下),通过视图导出,避免写一堆语句。
create or replace directory OUT_PATH_TEMP as '/data/bak';
4. 执行存储过程
-
begin
-
sql_to_csv('select * from tmp1201_all_v','OUT_PATH_TEMP','tmp1201_all_v.csv');
-
end;
-
/
测试700万左右数据导出约23分钟,主要是视图查询较慢,导出表应该更快。

参考
[转帖]oracle导出千万级数据为csv格式的更多相关文章
- php 连接oracle 导出百万级数据
1,我们一般做导出的思路就是,根据我们想要的数据,全部查询出来,然后导出来,这个对数据量很大的时候会很慢,这里我提出来的思想就是分页和缓冲实现动态输出. 2.普通的我就不说了,下面我说一下分页和内存刷 ...
- mysql循环插入千万级数据
mysql使用存储过程循环插入大量数据,简单的一条条循环插入,效率会很低,需要考虑批量插入. 测试准备: 1.建表: CREATE TABLE `mysql_genarate` ( `id` ) NO ...
- 使用POI导出百万级数据到excel的解决方案
1.HSSFWorkbook 和SXSSFWorkbook区别 HSSFWorkbook:是操作Excel2003以前(包括2003)的版本,扩展名是.xls,一张表最大支持65536行数据,256列 ...
- .Net Core导入千万级数据至Mysql
最近在工作中,涉及到一个数据迁移功能,从一个txt文本文件导入到MySQL功能. 数据迁移,在互联网企业可以说经常碰到,而且涉及到千万级.亿级的数据量是很常见的.大数据量迁移,这里面就涉及到一个问题 ...
- 用php导入10W条+ 级别的csv大文件数据到mysql。导出10W+级别数据到csv文件
转自:http://blog.csdn.net/think2me/article/details/12999907 1. 说说csv 和 Excel 这两者都是我们平时导出或者导入数据一般用到的载体. ...
- 数组转xls格式的excel文件&数据转csv格式的excle
/** * 数组转xls格式的excel文件 * @param array $data 需要生成excel文件的数组 * @param string $filename 生成的excel文件名 * 示 ...
- python 爬虫数据存入csv格式方法
python 爬虫数据存入csv格式方法 命令存储方式:scrapy crawl ju -o ju.csv 第一种方法:with open("F:/book_top250.csv" ...
- mysql千万级数据表,创建表及字段扩展的几条建议
一:概述 当我们设计一个系统时,需要考虑到系统的运行一段时间后,表里数据量大约有多少,如果在初期,就能估算到某几张表数据量非常庞大时(比如聊天消息表),就要把表创建好,这篇文章从创建表,增加数据,以及 ...
- Oracle导出数据结构和数据表的方法
1.PLSQL导出数据结构(数据表.序列.触发器.函数.视图) 1)在左侧 点击tables 2)Tools-->Export User Objects 3)红色1 是你要选择导出的表,红色2 ...
- Python数据写入csv格式文件
(只是传递,基础知识也是根基) Python读取数据,并存入Excel打开的CSV格式文件内! 这里需要用到bs4,csv,codecs,os模块. 废话不多说,直接写代码!该重要的内容都已经注释了, ...
随机推荐
- Linux驱动开发笔记(六):用户层与内核层进行数据传递的原理和Demo
前言 驱动作为桥梁,用户层调用预定义名称的系统函数与系统内核交互,而用户层与系统层不能直接进行数据传递,进行本篇主要就是理解清楚驱动如何让用户编程来实现与内核的数据交互传递. 温故知新 设备节 ...
- Java反序列化漏洞-CC1利用链分析
@ 目录 一.前置知识 1. 反射 2. Commons Collections是什么 3. 环境准备 二.分析利用链 1. Transformer 2. InvokeTransformer 执行命令 ...
- 简单介绍JDK、JRE、JVM三者区别
简单介绍JDK vs JRE vs JVM三者区别 文编|JavaBuild 哈喽,大家好呀!我是JavaBuild,以后可以喊我鸟哥,嘿嘿!俺滴座右铭是不在沉默中爆发,就在沉默中灭亡,一起加油学习, ...
- 《RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation Extraction》阅读笔记
代码 原文地址 预备知识: 1.什么是元学习(Meta Learning)? 元学习或者叫做"学会学习"(Learning to learn),它是要"学会如何学 ...
- 为什么OpenAPI是未来企业数字化转型的决定性因素?
本文分享自华为云开发者联盟公众号<为什么OpenAPI是未来企业数字化转型的决定性因素?>. 随着数字经济不断发展升级,数据互通.万物互联正在逐步成为IT产业发展的主旋律,企业数字化转型也 ...
- 再谈BOM和DOM(4):DOM0/DOM2事件处理分析
JavaScript能够让网站对用户的各种操作及时做出"反馈",响应用户交互行为,而这些就是:DOM,事件以及事件处理 DOM就是操作的元素,这个看<再谈BOM和DOM(1) ...
- 大银行数字化升级之后,火山引擎 VeDI 这次要把能力带给中小金融机构
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 数据技术是金融行业数字化转型的重要动力. 近年来,各大银行在全面推进数据技术建设上动作频频.比如,建设银行深化平台经营,依 ...
- 【Boost】Windows端使用 MSVC14.2 编译 Boost 并在 CMake 项目中使用
Write 2023.7.24 关于 boost 在 Windows 下的使用 gcc 安装与 CLion 的配置, 能够查到的英文资料都比较少, 踩过坑后记录一下. MinGW 安装 Boost B ...
- POJ3414 Pots( BFS搜索)
题目: 给你两个容器,分别能装下A升水和B升水,并且可以进行以下操作 FILL(i) 将第i个容器从水龙头里装满(1 ≤ i ≤ 2); DROP(i) 将第i个容器抽干 POUR(i,j) 将第i个 ...
- Codeforces Round #645 (Div. 2)
这一次的Div.2 大多数学思维.. A. Park Lightingtime https://codeforces.com/contest/1358/problem/A 题意:给一个n,m为边的矩形 ...