详解如何挑战4秒内百万级数据导入SQL Server（转）

对于大数据量的导入，是DBA们经常会碰到的问题，在这里我们讨论的是SQL Server环境下百万级数据量的导入，希望对大家有所帮助。51CTO编辑向您推荐《SQL Server入门到精通》专题。

实际工作中有时候需要把大量数据导入数据库，然后用于各种程序计算，本实验将使用5中方法完成这个过程，并详细记录各种方法所耗费的时间。

本实验中所用到工具为Visual Studio 2008和SQL Server 2000、SQL Server 2008，分别使用5中方法将100万条数据导入SQL Server 2000与SQL Server 2008中，实验环境是DELL 2850双2.0GCPU，2G内存的服务器。感兴趣的朋友可以下载源代码自己验证一下所用时间。

还要有一点需要进行说明，本实验中执行SQL语句的地方使用了IsLine FrameWork框架中的DataProvider模块，这个模块只是对SQL配置的读取和封装，并不会对最终结果有本质性的影响，关于IsLine FrameWork框架方面的知识，请参考“IsLine FrameWork”框架系列文章。

下面进入正题，分别使用基本的Insert 语句、使用BULK INSERT语句、在多线程中使用BULK INSERT、使用SqlBulkCopy类、在多线程中使用SqlBulkCopy类五种方法，挑战4秒极限。

数据库方面使用SQL Server 2000与SQL Server 2008，表名TableB，字段名称为Value1，数据库名可以在App.config中修改，默认为test。

图1 试验中的5种方法

方法一.使用基本的Insert 语句

这种方法是最基本的方法，大多数人一开始都会想到这种方法。但是Insert语句似乎并不适合大批量的操作，是不是这样呢?

本方法中将100万数据分为10个批次，每个批次10万条，每10万条1个事务，分10次导入数据库。

-->基本语句:

Insert Into TableB (Value1) values (‘”+i+”’);

说明：语句中的i是宿主程序中的一个累加变量，用于填充数据库字段中的值。

SQL Server 2000 耗时：901599

SQL Server 2008耗时：497638

方法二.使用BULK INSERT语句

这个类的效果，在本实验中可以说是最令人满意的了，它的使用最简便、灵活，速度很快。

“BULK INSERT”语句似乎不是很常用， Aicken听说Oracle中有一种可以将外部文件映射为Oracle临时表，然后直接将临时表中的数据导入Oracle其他表中的方法，这种方法的速度非常令人满意，SQL SERVER的BULK INSERT是不是同样令人满意呢?

-->　基本语句：

BULK INSERT TableB FROM 'c:\\sql.txt'
WITH (FIELDTERMINATOR = ',',ROWTER /.,mbMINATOR='|',BATCHSIZE = 100000)

说明：“c:\\sql.txt”是一个预先生成的包含100条数据的文件，这些数据以“|”符号分隔，每10万条数据一个事务。

SQL Server 2000耗时：4009

SQL Server 2008耗时：10722

方法三.在多线程中使用BULK INSERT

在方法二的基础上，将100万条数据分五个线程，每个线程负责20万条数据，每5万条一个事物，五个线程同时启动，看看这样的效果吧。

SQL Server 2000耗时：21099

SQL Server 2008耗时：10997

方法四.使用SqlBulkCopy类

这种方法速度也很快，但是要依赖内存，对于几千万条、多字段的复杂数据，可能在内存方面会有较大的消耗，不过可以使用64位解决方案处理这个问题。

几千万条、多字段的数据的情况一般在一些业务场景中会遇到，比如计算全球消费者某个业务周期消费额时，要先获得主数据库表中的会员消费记录快照，并将快照储存至临时表中，然后供计算程序使用这些数据。并且有些时候消费者的消费数据并不在一台数据库服务器中，而是来自多个国家的多台服务器，这样我们就必须借助内存或外存设备中转这些数据，然后清洗、合并、检测，最后导入专用表供计算程序使用。

基本语句：

using (System.Data.SqlClient.SqlBulkCopy sqlBC = new System.Data.SqlClient.SqlBulkCopy(conn))
{ sqlBC.BatchSize = 100000;
sqlBC.BulkCopyTimeout = 60;
sqlBC.DestinationTableName = "dbo.TableB";
sqlBC.ColumnMappings.Add("valueA", "Value1");
sqlBC.WriteToServer(dt);
}

说明：

BatchSize = 100000; 指示每10万条一个事务并提交

BulkCopyTimeout = 60; 指示60秒按超时处理

DestinationTableName = "dbo.TableB"; 指示将数据导入TableB表

ColumnMappings.Add("valueA", "Value1"); 指示将内存中valueA字段与TableB中的Value1字段匹配

WriteToServer(dt);写入数据库。其中dt是预先构建好的DataTable，其中包含valueA字段。

SQL Server 2000耗时：4989

SQL Server 2008耗时：10412

方法五.在多线程中使用SqlBulkCopy类

基于方法四，将100万条数据分五个线程，每个线程负责20万条数据，每5万条一个事物，五个线程同时启动，看看这样的效果吧。

SQL 2000耗时：7682

SQL 2008耗时：10870

总结

数据库测试方式	SQL 2000	SQL 2008
基本Insert Into	901599	497638
单线程Bulk Insert	4209	10722
多线程Bulk Insert	21099	10997
单线程SqlBulkCopy	4989	10412
多线程SqlBulkCopy	7682	10870

以上就是这几天的实验结果了，比较令人失望的是SQL SERVER 2008导入数据的性能似乎并不想我们想象的那样优秀。

源码地址：http://files.cnblogs.com/isline/sqltest.rar

测试数据下载地址：http://files.cnblogs.com/isline/Data.rar

详解如何挑战4秒内百万级数据导入SQL Server（转）的更多相关文章

实战手记：让百万级数据瞬间导入SQL Server
想必每个DBA都喜欢挑战数据导入时间,用时越短工作效率越高,也充分的能够证明自己的实力.实际工作中有时候需要把大量数据导入数据库,然后用于各种程序计算,本文将向大家推荐一个挑战4秒极限让百万级数据瞬间 ...
【转】实战手记：让百万级数据瞬间导入SQL Server
想必每个DBA都喜欢挑战数据导入时间,用时越短工作效率越高,也充分的能够证明自己的实力.实际工作中有时候需要把大量数据导入数据库,然后用于各种程序计算,本文将向大家推荐一个挑战4秒极限让百万级数据瞬间 ...
极限挑战—C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码)
原文:极限挑战-C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码) 实际工作中有时候需要把大量数据导入数据库,然后用于各种程序计算,本实验将使用5中方法完成这个过程,并详细记录各种方 ...
linux awk命令详解，使用system来内嵌系统命令， awk合并两列
linux awk命令详解简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码)
作者: Aicken(李鸣) 来源: 博客园发布时间: 2010-09-08 15:00 阅读: 4520 次推荐: 0 原文链接 [收藏] 摘要: ...
JDBC详解系列（四）之建立Stament和执行SQL语句
建立Stament 在获得连接之后,我们就可以跟数据库进行交互了. 在JDBC中,我们发送SQL语句到数据库这些操作时通过Stament,Preparement,CallableStateme ...
详解用Navicat工具将Excel中的数据导入Mysql中
第一步:首先需要准备好有数据的excel: 第二步:选择"文件"->"另存为",保存为"CSV(逗号分隔)(*.csv)",将exce ...
详解EBS接口开发之库存事务处理-物料批次导入
库存事务处理-物料批次导入 --系统批次表 SELECT * FROM MTL_LOT_NUMBERS T; --API创建批次 inv_lot_api_pub.create_inv_lot(x_re ...
ES6详解八：模块（Module）！--各种导入导出方法
[-] 基本用法命名导出named exports 默认导出命名导出结合默认导出仅支持静态导入导出各种导入和导出方式总结 modules是ES6引入的最重要一个特性. 所以以后再写模块,直 ...

随机推荐

8种形式的Android Dialog使用举例
在Android开发中,我们经常会需要在Android界面上弹出一些对话框,比如询问用户或者让用户选择.这些功能我们叫它Android Dialog对话框,在我们使用Android的过程中,我归纳了一 ...
EJB(Enterprise JavaBean)科普
该文章是引用的,主要用于自己的学习,然后是记载免得忘记的时候到处乱找.结尾有引用地址. 到底EJB是什么?被口口相传的神神秘秘的,百度一番,总觉得没有讲清楚的,仍觉得一头雾水.百度了很久,也从网络的文 ...
python元组与字典
一.元组 1.元组的表达 (1,2,3,4) ('olive',123) ("python",) 创建元组: a=tuple((1,2,3,)) b=("python&q ...
niginx相关命令及代理配置
安装 in mac https://www.cnblogs.com/meng1314-shuai/p/8335140.html Nginx相关命令 mac下启动: 通过brew 安装install 后 ...
Java并发编程中的若干核心技术，向高手进阶！
来源:http://www.jianshu.com/p/5f499f8212e7 引言本文试图从一个更高的视角来总结Java语言中的并发编程内容,希望阅读完本文之后,可以收获一些内容,至少应该知道在 ...
那些使用VSCode写Python踩过的坑(Anaconda配置)
1. 如何在vscode上配置的配置方法请务必一定要直接参考官方文档Getting Started with Python in VS Code,不要去看什么杂七杂八的blog,要么过时要么不准确要么 ...
在python3中的编码
在python3中的编码 #_author:Administrator#date:2019/10/29import sysprint(sys.getdefaultencoding())#utf-8 打 ...
itextPDF使用笔记
最近在做报表打印,使用的是itextPDF,第一次用到它,简单做个笔记.主要涉及到字体设置,文字处理操作,表格及单元格设置,绘制一些图形 IText中有三个处理text的类com.lowagie.te ...
php日期
PHP Date() 函数 PHP date() 函数用于格式化时间/日期. 该函数可把时间戳格式化为可读性更好的日期和时间. 时间戳是一个字符序列,表示一定的事件发生的日期/时间. 语法 date( ...
vue alert插件（标题为图片）（自写）
<template> <div class="modelSelf"> <div class="model" @click=&quo ...

详解如何挑战4秒内百万级数据导入SQL Server（转）

详解如何挑战4秒内百万级数据导入SQL Server（转）的更多相关文章

随机推荐

热门专题