C# & SQL Server大数据量插入方式对比

以下内容大部分来自：

http://blog.csdn.net/tjvictor/article/details/4360030

部分内容出自互联网，实验结果为亲测。

最近自己开发一个向数据库中插入大量历史数据的函数库，需要解决一个大数据量插入的效率问题。不用分析，我知道如果采取逐条数据插入的方式，那么效率肯定很低，光是那么多循环就知道很慢了。于是乎，我找到了上篇博客，知道了BulkCopy和TVPs方式。为了更好的了解其效率，我自己动手亲测了一下效果，测试的数据库位于本机。

（1）方式1：循环插入

        public static void NormalInerst(String connString)

        {

            Console.WriteLine("使用NNormalInerst方式：");

            Stopwatch sw = new Stopwatch();

            SqlConnection sqlConn = new SqlConnection(connString);

            SqlCommand sqlCmd = new SqlCommand();

            sqlCmd.CommandText = String.Format("insert into BulkTestTable(Id,UserName,Pwd)values(@p0,@p1,@p2)");

            sqlCmd.Parameters.Add("@p0", SqlDbType.Int);

            sqlCmd.Parameters.Add("@p1", SqlDbType.NVarChar);

            sqlCmd.Parameters.Add("@p2", SqlDbType.VarChar);

            sqlCmd.CommandType = CommandType.Text;

            sqlCmd.Connection = sqlConn;

            sqlConn.Open();

            try

            {

                for (int i = , j = ; i < ; ++i )

                {

                    for (j = i * ; j < (i + ) * ; ++j )

                    {

                        sqlCmd.Parameters["@p0"].Value = j;

                        sqlCmd.Parameters["@p1"].Value = String.Format("User-{0}", i * j);

                        sqlCmd.Parameters["@p2"].Value = String.Format("Pwd-{0}", i * j);

                        sw.Start();

                        sqlCmd.ExecuteNonQuery();

                        sw.Stop();

                    }

                    Console.WriteLine("第{0}次插入{1}条数据耗时：{2}", (i + ), dataScale, sw.ElapsedMilliseconds);

                    sw.Reset();

                }

            }

            catch (System.Exception ex)

            {

                throw ex;

            }

            finally

            {

                sqlConn.Close();

            }

        }

该方式的效率极低，运行时间很长，我这里就不给出结果了，有兴趣可以自己粘贴试一下。PS:其中的数据规模应该是dataScale而不是10000，不过总是还是慢。

（2）方式2：使用BulkCopy

        public static void BulkInerst(String connString)

        {

            Console.WriteLine("使用BulkInerst方式：");

            Stopwatch sw = new Stopwatch();

            String strDel = "delete from BulkTestTable";

            float millTime = ;

            for (int multiply = ; multiply < ; multiply++)

            {

                DataTable dt = GetTableSchema();

                for (int count = multiply * dataScale; count < (multiply + ) * dataScale; count++)

                {

                    DataRow r = dt.NewRow();

                    r[] = count;

                    r[] = string.Format("User-{0}", count * multiply);

                    r[] = string.Format("Pwd-{0}", count * multiply);

                    dt.Rows.Add(r);

                }

                SqlConnection sqlConn = new SqlConnection(connString);

                SqlBulkCopy bulkCopy = new SqlBulkCopy(sqlConn);

                bulkCopy.DestinationTableName = "BulkTestTable";

                bulkCopy.BatchSize = dt.Rows.Count;

                sw.Reset();

                sw.Start();

                try

                {

                    sqlConn.Open();

                    if (dt != null && dt.Rows.Count != )

                        bulkCopy.WriteToServer(dt);

                }

                catch (Exception ex)

                {

                    throw ex;

                }

                finally

                {

                    sqlConn.Close();

                    if (bulkCopy != null)

                        bulkCopy.Close();

                }

                sw.Stop();

                Console.WriteLine("第{0}次插入{1}条数据耗时：{2}", (multiply + ), dataScale, sw.ElapsedMilliseconds);

                millTime += sw.ElapsedMilliseconds;

            }

            Console.WriteLine("总耗时：{0}毫秒，平均耗时：{1}毫秒", millTime, millTime / );

            SqlConnection sqlConn2 = new SqlConnection(connString);

            SqlCommand sqlCmd = new SqlCommand(strDel, sqlConn2);

            try

            {

                sqlConn2.Open();

                sqlCmd.ExecuteNonQuery();

            }

            catch (Exception ex)

            {

                throw ex;

            }

            finally

            {

                sqlConn2.Close();

            }

            Console.WriteLine("Done!");

        }

（3）方式3：使用TVPs

        public static void TVPsInerst(String connString)

        {

            Console.WriteLine("使用TVPsInerst方式：");

            Stopwatch sw = new Stopwatch();

            SqlConnection sqlConn = new SqlConnection(connString);

            String strSQL = "insert into BulkTestTable (Id,UserName,Pwd)" +

                " SELECT nc.Id, nc.UserName,nc.Pwd" +

                " FROM @NewBulkTestTvp AS nc";

            String strDel = "delete from BulkTestTable";

            float millTime = ;

            for (int multiply = ; multiply < ; multiply++)

            {

                DataTable dt = GetTableSchema();

                for (int count = multiply * dataScale; count < (multiply + ) * dataScale; count++)

                {

                    DataRow r = dt.NewRow();

                    r[] = count;

                    r[] = string.Format("User-{0}", count * multiply);

                    r[] = string.Format("Pwd-{0}", count * multiply);

                    dt.Rows.Add(r);

                }

                sw.Reset();

                sw.Start();

                SqlCommand cmd = new SqlCommand(strSQL, sqlConn);

                SqlParameter catParam = cmd.Parameters.AddWithValue("@NewBulkTestTvp", dt);

                catParam.SqlDbType = SqlDbType.Structured;

                catParam.TypeName = "dbo.BulkUDT";

                try

                {

                    sqlConn.Open();

                    if (dt != null && dt.Rows.Count != )

                    {

                        cmd.ExecuteNonQuery();

                    }

                }

                catch (Exception ex)

                {

                    throw ex;

                }

                finally

                {

                    sqlConn.Close();

                }

                sw.Stop();

                Console.WriteLine("第{0}次插入{1}条数据耗时：{2}", (multiply + ), dataScale, sw.ElapsedMilliseconds);

                millTime += sw.ElapsedMilliseconds;

            }

            Console.WriteLine("总耗时：{0}毫秒，平均耗时：{1}毫秒", millTime, millTime / );

            SqlCommand sqlCmd = new SqlCommand(strDel, sqlConn);

            try

            {

                sqlConn.Open();

                sqlCmd.ExecuteNonQuery();

            }

            catch (Exception ex)

            {

                throw ex;

            }

            finally

            {

                sqlConn.Close();

            }

            Console.WriteLine("Done!");

        }

这里TVPs方式需要利用Visual Studio 2008采用的自定义数据表类型，这是一个比较新的东西。这里补充几个类型和函数，主要是为了检测数据库中是否存在数据表和数据表类型，如果不存在则进行创建。补充代码如下：

        public enum CheckType

        {

            isTable = ,

            isType

        }

        protected static int dataScale = ;

        public static bool CheckExistsObject(String connString, String objectName, CheckType type)

        {

            String strSQL = "select COUNT(1) from sys.sysobjects where name='" + objectName + "'";

            switch (type)

            {

                case CheckType.isTable:

                    strSQL = "select COUNT(1) from sys.sysobjects where name='" + objectName + "'";

                    break;

                case CheckType.isType:

                    strSQL = "select COUNT(1) from sys.types where name='" + objectName + "'";

                    break;

                default:

                    break;

            }

            using (SqlConnection conn = new SqlConnection(connString))

            {

                conn.Open();

                SqlCommand cmd = new SqlCommand(strSQL, conn);

                int result = Convert.ToInt32(cmd.ExecuteScalar());

                if ( == result)

                {

                    return false;

                }

            }

            return true;

        }

        public static bool CreateObject(String connString, String objectName, CheckType type)

        {

            String strSQL = "";

            switch (type)

            {

                case CheckType.isTable:

                    strSQL = "Create table " + objectName + " (Id int primary key, UserName nvarchar(32), Pwd varchar(16))";

                    break;

                case CheckType.isType:

                    strSQL = "CREATE TYPE " + objectName + " AS TABLE (Id int, UserName nvarchar(32), Pwd varchar(16))";

                    break;

                default:

                    break;

            }

            using (SqlConnection conn = new SqlConnection(connString))

            {

                conn.Open();

                SqlCommand cmd = new SqlCommand(strSQL, conn);

                cmd.ExecuteNonQuery();

            }

            return true;

        }

        public static DataTable GetTableSchema()

        {

            DataTable dt = new DataTable();

            dt.Columns.AddRange(new DataColumn[]{

                    new DataColumn("Id",typeof(int)),

                    new DataColumn("UserName",typeof(string)),

                    new DataColumn("Pwd",typeof(string))});

            return dt;

        }

调用的方式就很好说了，参见如下测试代码：

        public static void Main(string[] args)

        {

            String conString = "Persist Security Info=False;User ID=sa;Password=scbj123!@#;Initial Catalog=testGR;Server=KLH-PC";

            String strType = "BulkUDT";

            String strTable = "BulkTestTable";

            if (!CheckExistsObject(conString, strType, CheckType.isType))

            {

                Console.WriteLine("类型{0}不存在", strType);

                if (CreateObject(conString, strType, CheckType.isType))

                {

                    Console.WriteLine("类型{0}创建成功！", strType);

                }

            }

            if (!CheckExistsObject(conString, strTable, CheckType.isTable))

            {

                Console.WriteLine("表格{0}不存在", strTable);

                if (CreateObject(conString, strTable, CheckType.isTable))

                {

                    Console.WriteLine("表格{0}创建成功！", strTable);

                }

            }

            Console.WriteLine("==================================================");

            //NormalInerst(conString);

            BulkInerst(conString);

            TVPsInerst(conString);

            Console.ReadKey();

        }

-------------------------------------------------------------------------------------------------

直接看效果对比：

<1>第一次运行

<2>第二次和第三次运行

这里考虑到了SQL Server自身缓存的原因，所以进行了多次测试，不过数据量没有变。可以从上述结果中看出：TVPs方式不愧是新出的啊，一代更比一代强！

C# & SQL Server大数据量插入方式对比的更多相关文章

sql server 2005 大数据量插入性能对比
sql server 2005大数据量的插入操作第一,写个存储过程,传入参数,存储过程里面是insert操作, 第二,用System.Data.SqlClient.SqlBulkCopy实例方法, ...
[转]Sql server 大数据量分页存储过程效率测试附代码
本文转自:http://www.cnblogs.com/lli0077/archive/2008/09/03/1282862.html 在项目中,我们经常遇到或用到分页,那么在大数据量(百万级以上)下 ...
SQL Server 大数据量insert into xx select慢的解决方案
最近项目有个需求,把一张表中的数据根据一定条件增删改到另外一张表.按理说这是个很简单的SQL.可是在实际过程中却出现了超级长时间的执行过程. 后来经过排查发现是大数据量insert into xx s ...
SQL Server 大数据量批量插入
private void AddShuJu_Click(object sender, RoutedEventArgs e) { Stopwatch wath = new Stopwatch(); wa ...
SQL Server 大数据量分页建议方案
简单的说就是这个 select top(20) * from( select *, rowid = row_number() over(order by xxx) from tb with(noloc ...
mysql/oracle jdbc大数据量插入优化
10.10.6 大数据量插入优化在很多涉及支付和金融相关的系统中,夜间会进行批处理,在批处理的一开始或最后一般需要将数据回库,因为应用和数据库通常部署在不同的服务器,而且应用所在的服务器一般也不会 ...
SQL优化-大数据量分页优化
百万数据量SQL,在进行分页查询时会出现性能问题,例如我们使用PageHelper时,由于分页查询时,PageHelper会拦截查询的语句会进行两个步骤 1.添加 select count(*)fro ...
sql server 大数据，统计分组查询，数据量比较大计算每秒钟执行数据执行次数
-- 数据量比较大的情况,统计十分钟内每秒钟执行次数 ); -- 开始时间 ); -- 结束时间 declare @num int; -- 结束时间 set @begintime = '2019-08 ...
SQL Server 大数据搬迁之文件组备份还原实战
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 解决方案(Solution) 搬迁步骤(Procedure) 搬迁脚本(SQL Codes) ...

随机推荐

php 多进程workman服务器框架
今天搜php socket,发现了一个给力的php写socket的框架workman,有机会要用用. 好给力,原来那个小蝌蚪聊天室就是用这个开发的. 仿佛发现了新大陆.
Highcharts的基本属性和方法详解
Highcharts 是一个用纯JavaScript编写的一个图表库, 能够很简单便捷的在web网站或是web应用程序添加有交互性的图表,并且免费提供给个人学习.个人网站和非商业用途使用. 目前Hig ...
centos 服务器操作
CENTOS下创建FTP登录用户 yum install vsftpd2.启动/重启/关闭vsftpd服务器[root@localhost ftp]# /sbin/service vsftpd re ...
Codeforces Round #277 (Div. 2) A B C 水模拟贪心
A. Calculating Function time limit per test 1 second memory limit per test 256 megabytes input stand ...
3-5 RPM包校验
1.RPM包校验 <1>rpm -V 已安装的包名 <2>选项: -V 校验制定RPM包中的文件(verify) <3>说明: <1>若没有显示任何内容 ...
poj3159 最短路（差分约束）
题意:现在需要分糖果,有n个人,现在有些人觉得某个人的糖果数不能比自己多多少个,然后问n最多能在让所有人都满意的情况下比1多多少个. 这道题其实就是差分约束题目,根据题中给出的 a 认为 b 不能比 ...
console下纯字符实现的贪吃蛇
最近简直超级无聊-- code blocks win7 64编译运行无问题,应该其他编译器也不会有问题. w:上 s:下 a:左 d:右 CS标准方向控制,AK47和M4这种高级货是没有滴-- 废话不 ...
spring beans源码解读之--Bean的定义及包装
bean的定义,包装是java bean的基础.再怎么强调它的重要性都不为过,因此深入了解这块的代码对以后的代码研究可以起到事半功倍的功效. 1. Bean的定义BeanDefinition 1.1 ...
docker学习2-安装实践
windows上安装docker后,默认自动在后台运行,右下角有docker图标,鼠标右键点击出现菜单可以查看docker版本,对一些基本项进行设置如下: 安装及具体操作参见官方文档: https: ...
elasticsearch介绍集群,模拟横向扩展节点、节点宕机、改变分片
出处:[http://www.cnblogs.com/dennisit/p/4133131.html] ,防楼主删博,故保留一份! elasticsearch用于构建高可用和可扩展的系统.扩展 ...

C# & SQL Server大数据量插入方式对比

C# & SQL Server大数据量插入方式对比的更多相关文章

随机推荐

热门专题