1：MSSQL

SQL语法篇：

BULK INSERT

   [ database_name . [ schema_name ] . | schema_name . ] [ table_name | view_name ]

      FROM 'data_file'

     [ WITH

    (

   [ [ , ] BATCHSIZE = batch_size ]

   [ [ , ] CHECK_CONSTRAINTS ]

   [ [ , ] CODEPAGE = { 'ACP' | 'OEM' | 'RAW' | 'code_page' } ]

   [ [ , ] DATAFILETYPE =

      { 'char' | 'native'| 'widechar' | 'widenative' } ]

   [ [ , ] FIELDTERMINATOR = 'field_terminator' ]

   [ [ , ] FIRSTROW = first_row ]

   [ [ , ] FIRE_TRIGGERS ]

   [ [ , ] FORMATFILE = 'format_file_path' ]

   [ [ , ] KEEPIDENTITY ]

   [ [ , ] KEEPNULLS ]

   [ [ , ] KILOBYTES_PER_BATCH = kilobytes_per_batch ]

   [ [ , ] LASTROW = last_row ]

   [ [ , ] MAXERRORS = max_errors ]

   [ [ , ] ORDER ( { column [ ASC | DESC ] } [ ,...n ] ) ]

   [ [ , ] ROWS_PER_BATCH = rows_per_batch ]

   [ [ , ] ROWTERMINATOR = 'row_terminator' ]

   [ [ , ] TABLOCK ]

   [ [ , ] ERRORFILE = 'file_name' ]

    )]

SQL示例：

 bulk insert 表名  from 'D:\mydata.txt'

with

 (fieldterminator=',',

 rowterminator='\n',

 check_constraints)

select * from 表名

由于C#提供了SqlBulkCopy，所以非DBA的我们，更多会通过程序来调用：

C#代码篇：

C#代码调用示例及细节，以下代码摘录自CYQ.Data：

using (SqlBulkCopy sbc = new SqlBulkCopy(con, (keepID ? SqlBulkCopyOptions.KeepIdentity : SqlBulkCopyOptions.Default) | SqlBulkCopyOptions.FireTriggers, sqlTran))

                    {

                        sbc.BatchSize = ;

                        sbc.DestinationTableName = SqlFormat.Keyword(mdt.TableName, DalType.MsSql);

                        sbc.BulkCopyTimeout = AppConfig.DB.CommandTimeout;

                        foreach (MCellStruct column in mdt.Columns)

                        {

                            sbc.ColumnMappings.Add(column.ColumnName, column.ColumnName);

                        }

                        sbc.WriteToServer(mdt);

                    }

有5个细节：

1：事务：

如果只是单个事务，构造函数可以是链接字符串。

如果需要和外部合成一个事务（比如先删除，再插入，这在同一个事务中）

就需要自己构造Connection对象和Transaction，在上下文中传递来处理。

2：插入是否引发触发器

通过SqlBulkCopyOptions.FireTriggers 引入

3：其它：批量数、超时时间、是否写入主键ID。

可能引发的数据库Down机的情况：

在历史的过程中，我遇到过的一个大坑是：

当数据的长度过长，数据的字段过短，产生数据二进制截断时，数据库服务竟然停掉了（也许是特例，也许不是）。

所以小心使用，尽力做好对外部数据做好数据长度验证。

2：MySql

关于MySql的批量，这是一段悲催的往事，有几个坑，直到今天，才发现并解决了。

SQL语法篇：

LOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE 'data.txt'

    [REPLACE | IGNORE]

    INTO TABLE tbl_name

    [FIELDS

        [TERMINATED BY 'string']

        [[OPTIONALLY] ENCLOSED BY 'char']

        [ESCAPED BY 'char' ]

    ]

    [LINES

        [STARTING BY 'string']

        [TERMINATED BY 'string']

    ]

    [IGNORE number LINES]

    [(col_name_or_user_var,...)]

    [SET col_name = expr,...)]

示例篇：

LOAD DATA LOCAL INFILE 'C:\\Users\\cyq\\AppData\\Local\\Temp\\BulkCopy.csv' INTO TABLE `BulkCopy` CHARACTER SET utf8 FIELDS TERMINATED BY '$,$' LINES TERMINATED BY '

' (`ID`,`Name`,`CreateTime`,`Sex`)

虽然MySql.Data.dll 提供了MySqlBulkLoader，但是看源码只是生成了个Load Data 并用ADO.NET执行，

核心大坑的生成*.csv数据文件的竟然没提供，所以自己生成语句并执行就好了，不需要用它。

C#代码篇：

以下代码摘自CYQ.Data，是一段今天才修正好的代码：

 private static string MDataTableToFile(MDataTable dt, bool keepID, DalType dalType)

        {

            string path = Path.GetTempPath() + dt.TableName + ".csv";

            using (StreamWriter sw = new StreamWriter(path, false, new UTF8Encoding(false)))

            {

                MCellStruct ms;

                string value;

                foreach (MDataRow row in dt.Rows)

                {

                    for (int i = ; i < dt.Columns.Count; i++)

                    {

                        #region 设置值

                        ms = dt.Columns[i];

                        if (!keepID && ms.IsAutoIncrement)

                        {

                            continue;

                        }

                        else if (dalType == DalType.MySql && row[i].IsNull)

                        {

                            sw.Write("\\N");//Mysql用\N表示null值。

                        }

                        else

                        {

                            value = row[i].ToString();

                            if (ms.SqlType == SqlDbType.Bit)

                            {

                                int v = (value.ToLower() == "true" || value == "") ?  : ;

                                if (dalType == DalType.MySql)

                                {

                                    byte[] b = new byte[];

                                    b[] = (byte)v;

                                    value = System.Text.Encoding.UTF8.GetString(b);//mysql必须用字节存档。

                                }

                                else

                                {

                                    value = v.ToString();

                                }

                            }

                            else

                            {

                                value = value.Replace("\\", "\\\\");//处理转义符号

                            }

                            sw.Write(value);

                        }

                        if (i != dt.Columns.Count - )//不是最后一个就输出

                        {

                            sw.Write(AppConst.SplitChar);

                        }

                        #endregion

                    }

                    sw.WriteLine();

                }

            }

            if (Path.DirectorySeparatorChar == '\\')

            {

                path = path.Replace(@"\", @"\\");

            }

            return path;

        }

以上代码是产生一个csv文件，用于被调用，有两个核心的坑，费了我不少时间：

1：Bit类型数据导不进去？

2：第1行数据自增ID被重置为1？

这两个问题，网上搜不到答案，放纵到今天，觉的应该解决了，然后就把它解决了。

解决的思路是这样的：

A：先用Load Data OutFile导出一个文件，再用Load Data InFile导入文件。

一开始我用记事本打开看了一下，又顺手Ctrl+S了一下，结果发现问题和我的一样，让我怀疑竟然不支持？

直到今天，重新导出，中间不看了，直接导入，发现它竟然又正常的，于是，思维一转：

B：把自己生成的文件和命令产生的文件，进行了十六进制比对，结果发现：

Bit类型自己生成的的数据：是0，1，在十六进制下显示是30、31。

命令产生的数据在十六进制是00、01，查了下资料，发现MySql的Bit存档的Bit是二进制。

于是，把0，1用字节表示，再转字符串，再存档，就好了。

于是这么一段代码产生了（网上的DataTable转CSV代码都是没处理的，都不知道他们是怎么跑的，难道都没有定义Bit类型？）：

if (ms.SqlType == SqlDbType.Bit)

{

     int v = (value.ToLower() == "true" || value == "1") ? 1 : 0;

     if (dalType == DalType.MySql)

     {

           byte[] b = new byte[1];

           b[0] = (byte)v;

           value = System.Text.Encoding.UTF8.GetString(b);//mysql必须用字节存档。

       }

      else

       {

            value = v.ToString();

       }

}

另外关于Null值，用\N表示。

解决完第一个问题，剩下就是第二个问题了，为什么第一个行代码的主键会被置为1？

还是比对十六进制，结果惊人的发现：

是BOM头，让它错识别了第一个主键值，所以被忽略主键，用了第1个自增值1替代了。

这也解释了为什么只要重新保存的数据都有Bug的原因。

于是，解决的方法就是StreaWrite的时候，不生成BOM头，怎么处理呢？

于是就有了以下的代码：

 using (StreamWriter sw = new StreamWriter(path, false, new UTF8Encoding(false)))

{

       ...................

}

通过New一个Encoding，并指定参数为false，替代我们常规的System.Text.Encoding.UTF8Encoding。

这些细节很隐秘，不说你都猜不道。。。

3：Oracle

SQL语法篇

LOAD[DATA]

[ { INFILE | INDDN } {file | * }

[STREAM | RECORD | FIXED length [BLOCKSIZE size]|

VARIABLE [length] ]

[ { BADFILE | BADDN } file ]

{DISCARDS | DISCARDMAX} integr ]

[ {INDDN | INFILE} . . . ]

[ APPEND | REPLACE | INSERT ]

[RECLENT integer]

[ { CONCATENATE integer |

CONTINUEIF { [THIS | NEXT] (start[: end])LAST }

Operator { 'string' | X 'hex' } } ]

INTO TABLE [user.]table

[APPEND | REPLACE|INSERT]

[WHEN condition [AND condition]...]

[FIELDS [delimiter] ]

(

column {

RECNUM | CONSTANT value |

SEQUENCE ( { integer | MAX |COUNT} [, increment] ) |

[POSITION ( { start [end] | * [ + integer] }

) ]

datatype

[TERMINATED [ BY ] {WHITESPACE| [X] 'character' } ]

[ [OPTIONALLY] ENCLOSE[BY] [X]'charcter']

[NULLIF condition ]

[DEFAULTIF condotion]

}

[ ,...]

)

以上配置存档成一个CTL文件，再由以下的命令调用：

Sqlldr userid=用户名/密码@数据库 control=文件名.ctl

C#语法篇：

.NET里大概有三种操作Oracle的手法：

1：System.Data.OracleClient （需要安装客户端）没有带批量方法（还区分x86和x64）。

2：Oracle.DataAccess （需要安装客户端）带批量方法（也区分x86和x64）。

3：Oracle.ManagedDataAccess （不需要安装客户端）没带批量方法（不区分x86和x64，但仅支持.NET 4.0或以上）

Oracle.DataAccess 带的批量方法叫：OracleBulkCopy，由于使用方式和SqlBulkCopy几乎一致，就不介绍了。

如果调用程序所在的服务器安装了Oracle客户端，可以进行以下方法的调用：

流程如下：

1：产生*.cvs数据文件，见MySql中的代码，一样用的。

2：产生*.ctl控制文件，把生成的Load Data 语句存档成一个*.ctl文件即可。

3：用sqlidr.exe执行CTL文件，这里悲催的一点是，不能用ADO.NET调用，只能用进程调用，所以，这个批量只能单独使用。

调用进程的相关代码：

 bool hasSqlLoader = false;

        private bool HasSqlLoader() //检测是否安装了客户端。

        {

            hasSqlLoader = false;

            Process proc = new Process();

            proc.StartInfo.FileName = "sqlldr";

            proc.StartInfo.CreateNoWindow = true;

            proc.StartInfo.UseShellExecute = false;

            proc.StartInfo.RedirectStandardOutput = true;

            proc.OutputDataReceived += new DataReceivedEventHandler(proc_OutputDataReceived);

            proc.Start();

            proc.BeginOutputReadLine();

            proc.WaitForExit();

            return hasSqlLoader;

        }

        void proc_OutputDataReceived(object sender, DataReceivedEventArgs e)

        {

            if (!hasSqlLoader)

            {

                hasSqlLoader = e.Data.StartsWith("SQL*Loader:");

            }

        }

        //已经实现，但没有事务，所以暂时先不引入。

        private bool ExeSqlLoader(string arg)

        {

            try

            {

                Process proc = new Process();

                proc.StartInfo.FileName = "sqlldr";

                proc.StartInfo.Arguments = arg;

                proc.Start();

                proc.WaitForExit();

                return true;

            }

            catch

            {

            }

            return false;

        }

总结：

随着大数据的普及，数据间的批量移动必然越来频繁的被涉及，所以不管是用SQL脚本，还是自己写代码，或是用DBImport工具，都将成必备技能之一了！

鉴于此，分享一下我在这一块费过的力和填过的坑，供大伙参考！

分享MSSQL、MySql、Oracle的大数据批量导入方法及编程手法细节的更多相关文章

.net core利用MySqlBulkLoader大数据批量导入MySQL
最近用core写了一个数据迁移小工具,从SQLServer读取数据,加工后导入MySQL,由于数据量太过庞大,数据表都过百万,常用的dapper已经无法满足.三大数据库都有自己的大数据批量导入数据的方 ...
mysql/oracle jdbc大数据量插入优化
10.10.6 大数据量插入优化在很多涉及支付和金融相关的系统中,夜间会进行批处理,在批处理的一开始或最后一般需要将数据回库,因为应用和数据库通常部署在不同的服务器,而且应用所在的服务器一般也不会 ...
大数据批量导入，解决办法，实践从定时从 sqlserver 批量同步数据到 mySql
c#代码,批量导入数据代码 public class MySql_Target : ZFCommon.DataAccesser.Base.DABase { public MySql_Target() ...
MySQL分页查询大数据量优化方法
方法1: 直接使用数据库提供的SQL语句语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N适应场景: 适用于数据量较少的情况(元组百/千级)原因/缺点: ...
Sqoop_具体总结使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
一.使用Sqoop将MySQL中的数据导入到HDFS/Hive/HBase watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWFyb25oYWRvb3A=/ ...
c#几种数据库的大数据批量插入（SqlServer、Oracle、SQLite和MySql）
这篇文章主要介绍了c#几种数据库的大数据批量插入(SqlServer.Oracle.SQLite和MySql),需要的朋友可以了解一下. 在之前只知道SqlServer支持数据批量插入,殊不知道Ora ...
SQLErrorCodes loaded: [DB2, Derby, H2, HSQL, Informix, MS-SQL, MySQL, Oracle, PostgreSQL, Sybase
sqlserver 插入数据的时候插入失败,报错内容为 “SQLErrorCodes loaded: [DB2, Derby, H2, HSQL, Informix, MS-SQL, MySQL, ...
SQLErrorCodes loaded: [DB2, Derby, H2, HSQL, Informix, MS-SQL, MySQL, Oracle, PostgreSQL, Sybase, Hana]
Loading XML bean definitions from class path resource [org/springframework/jdbc/support/sql-error-co ...
EF大数据批量添加性能问题（续）
昨天在园子里发了一篇如题的文章EF大数据批量添加性能问题,就引来一大堆的吐槽,我认为知识就应该这样分享出来,不然总以为自己很了不起:再说说昨天那篇文章,很多自认为很牛逼的人都评论说把SaveChang ...

随机推荐

如何一步一步用DDD设计一个电商网站（四）—— 把商品卖给用户
阅读目录前言怎么卖领域服务的使用回到现实结语一.前言上篇中我们讲述了“把商品卖给用户”中的商品和用户的初步设计.现在把剩余的“卖”这个动作给做了.这里提醒一下,正常情况下,我们的每一步业 ...
Ignite性能测试以及对redis的对比
测试方法为了对Ignite做一个基本了解,做了一个性能测试,测试方法也比较简单主要是针对client模式,因为这种方法和使用redis的方式特别像.测试方法很简单主要是下面几点: 不作参数优化,默认 ...
开源：Taurus.MVC 框架
为什么要创造Taurus.MVC: 记得被上一家公司忽悠去负责公司电商平台的时候,情况是这样的: 项目原版是外包给第三方的,使用:WebForm+NHibernate,代码不堪入目,Bug无限,经常点 ...
利用bootstrap的carousel.js实现轮播图动画
前期准备: 1.jquery.js. 2.bootstrap的carousel.js. 3.bootstrap.css. 如果大家不知道在哪下载,可以联系小颖,小颖把这些js和css可以发送给你. 一 ...
流程开发Activiti 与SpringMVC整合实例
流程(Activiti) 流程是完成一系列有序动作的概述.每一个节点动作的结果将对后面的具体操作步骤产生影响.信息化系统中流程的功能完全等同于纸上办公的层级审批,尤其在oa系统中各类电子流提现较为明显 ...
解决Android Studio 无法显示Layout视图问题
在Android Studio 当中,如果你选择的SDK的版本与你所显示的视图版本不一致时,会出现这个错误 Exception raised during rendering:com/android ...
redis成长之路——（一）
为什么使用redis Redis适合所有数据in-momory的场景,虽然Redis也提供持久化功能,但实际更多的是一个disk-backed的功能,跟传统意义上的持久化有比较大的差别,那么可能大家就 ...
scala练习题1 基础知识
1, 在scala REPL中输入3. 然后按下tab键,有哪些方法可以被调用? 24个方法可以被调用, 8个基本类型: 基本的操作符, 等: 2,在scala REPL中,计算3的平方根,然 ...
Boost信号/槽signals2
信号槽是Qt框架中一个重要的部分,主要用来解耦一组互相协作的类,使用起来非常方便.项目中有同事引入了第三方的信号槽机制,其实Boost本身就有信号/槽,而且Boost的模块相对来说更稳定. signa ...
RabbitMQ + PHP （三）案例演示
今天用一个简单的案例来实现 RabbitMQ + PHP 这个消息队列的运行机制. 主要分为两个部分: 第一:发送者(publisher) 第二:消费者(consumer) (一)生产者 (创建一个r ...

分享MSSQL、MySql、Oracle的大数据批量导入方法及编程手法细节

1：MSSQL

SQL语法篇：

C#代码篇：

可能引发的数据库Down机的情况：

2：MySql

SQL语法篇：

C#代码篇：

解决的思路是这样的：

3：Oracle

SQL语法篇

C#语法篇：

总结：

分享MSSQL、MySql、Oracle的大数据批量导入方法及编程手法细节的更多相关文章

随机推荐

热门专题