MSSQL批量写入数据方案

近来有一个项目Feature需要有批量写入数据的场景，正巧整理资料发现自己以前也类似实现的项目，在重构的同时把相关资料做了一个简单的梳理，方便大家参考。

循环写入（简单粗暴，毕业设计就这样干的）（不推荐）
Bulk Copy写入（>1000K 记录一次性写入推荐）
表值参数方式写入（mssql 2008新特性）（强烈推荐）

在SQL Server 2008未提供表值参数之前，需要将多行数据传递到存储过程或参数化sql命令我们一般会采用以下几个方法：

使用一系列单参数来表示多个数据列和行中的值。但使用这个方法会受所允许参数数量限制。Sql server 程序最多可以有2100个参数。服务器必须将这些参数进行再组织成临时表或表变量再进行后续处理。
将多个数据增加分隔字符串或序列化为xml字符串，然后将这些字符回传服务器。服务器根据解析字符串与xml进行处理。
将多条写入语句包装在一个单条语句当中。这种方式同sqldataadapter当中的update方法的实现逻辑，可以标识批次处理的个数。不过就算按照包装多个语句进行批次提交，每个语句仍然会分别在服务器上执行。（只是节约了请求的次数而已）
使用BCP实用工具或SqlBulkCopy对象将很多行数据加载到表中。尽管这荐技术非常有效，但不支持服务器处理，除非将数据加载到临时表或表变量中。

方案一

作为早期学习时出镜率最高的的实现方法我在这里就不特别说明了，在这里直接上码及测试数据：

public static void NormalInsertDate(DataTable dt)

        {

            using (var sqlConn = new SqlConnection(_testDataConnectionString))

            {

                var sql = "INSERT INTO Student(Name,Age) VALUES(@Name,@Age)";

                using (var cmd = new SqlCommand(sql, sqlConn))

                {

                    sqlConn.Open();

                    cmd.Parameters.Add("@Name", SqlDbType.NVarChar, );

                    cmd.Parameters.Add("@Age", SqlDbType.Int);

                    for (int i = ; i < dt.Rows.Count; i++)

                    {

                        cmd.Parameters["@Name"].Value = dt.Rows[i]["Name"];

                        cmd.Parameters["@Age"].Value = dt.Rows[i]["Age"];

                        cmd.ExecuteNonQuery();

                    }

                }

            }

        }

图一为每次10k条，写10次共计100k条数据总计15329ms

图二为每次100k条，写10次共计1000k条数据总计184395ms

方案二

作为早期批量写入的救星，批量写入的出镜指数4颗星。以下为测试数据：

        public static void BulkInsertData(DataTable dt)

        {

            using (var sqlConn = new SqlConnection(_testDataConnectionString))

            {

                using (var bulkCopy = new SqlBulkCopy(sqlConn)

                {

                    DestinationTableName = "Student",

                    BatchSize = dt.Rows.Count

                })

                {

                    sqlConn.Open();

                    bulkCopy.WriteToServer(dt);

                }

            }

        }

图一为每次10k条，写10次共计100k条数据总计1848ms

图二为每次100k条，写10次共计1000k条数据总计21584ms

方案三表值参数方式写入

表值参数提供一种将客户端应用程序中的多行数据封送到 SQL Server 的简单方式，而不需要多次往返或特殊服务器端逻辑来处理数据。您可以使用表值参数来包装客户端应用程序中的数据行，并使用单个参数化命令将数据发送到服务器。传入的数据行存储在一个表变量中，然后您可以通过使用 Transact-SQL 对该表变量进行操作。

可以使用标准的 Transact-SQL SELECT 语句来访问表值参数中的列值。表值参数为强类型，其结构会自动进行验证。表值参数的大小仅受服务器内存的限制。

注意：表值参数只能是输入参数，不能作为输出参数。

以下为相关实现：

1.创建表值参数类型(UDT)

USE Test

--CREATE TABLE

CREATE TABLE Student

(

Id INT IDENTITY(1,1) PRIMARY KEY,

Name NVARCHAR(50),

Age INT

)

--create table parameter type

CREATE TYPE StudentUDT AS TABLE

(

Name NVARCHAR(50),

Age INT

)

public static void TableParameterInsertData(DataTable dt)

{

    using (var sqlConn = new SqlConnection(_testDataConnectionString))

    {

        var sql = "INSERT INTO Student(Name,Age) SELECT Name, Age FROM @StudentTVPS";//在这里直接访问表值参数

        using (var cmd = new SqlCommand(sql, sqlConn))

        {

            var catParam = cmd.Parameters.AddWithValue("@StudentTVPS", dt);

            catParam.SqlDbType = SqlDbType.Structured;

            catParam.TypeName = "StudentUDT";//我们自定义的表值参数类型名称

            sqlConn.Open();

            cmd.ExecuteNonQuery();

        }

    }

}

图一为每次10k条，写10次共计100k条数据总计390ms

图二为每次100k条，写10次共计1000k条数据总计4451ms

最后我们再横向比较一下：

就我本机测试的情况来看，normal=9*bulk=42*tvps

另外我就一次性大量数据写入对bulk和tvps单独进行了测试，一次性写入100K条数据两种方案基本持平490ms

但在一次性写入1000K条数据时差距又再次被拉开,bulk=1.5tvps

就测试数据表明bulk在一次性大量写入依然有不小的优势，毕竟ms就是专门让他来做这个事情的。

然而也可以通过tvps进行分范围写入的方式，总消耗时间有小幅度改善。

所有呢，有大量数据一次性写入场景直接使用bulk copy方式吧。他当仁不让可以高效完成使命。

如果就一些普通业务批量场景无需考虑直接上TVPS方式。他的效率相对于较之前xml参数，复杂参数实现批量写入已经是数量级的提升。

你绝对值得拥有。

由于客户端硬件环境原因，测试环境应该不能非常精确。所以以上数据仅供参考。

欢迎大家一起分享交流。

附件本机测试硬件环境:i7 4770+128 ssd+8G内存；

MSSQL批量写入数据方案的更多相关文章

使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历
原文:使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历常常遇到需要向SQL Server插入批量数据,然后在存储过程中对这些数据进行进一步处理的情况.存储过 ...
HBase BulkLoad批量写入数据实战
1.概述在进行数据传输中,批量加载数据到HBase集群有多种方式,比如通过HBase API进行批量写入数据.使用Sqoop工具批量导数到HBase集群.使用MapReduce批量导入等.这些方式, ...
使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历
使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历原文:使用XML向SQL Server 2005批量写入数据——一次有关XML时间格式的折腾经历常常遇 ...
SQL Server 批量插入数据方案 SqlBulkCopy 的简单封装，让批量插入更方便
一.Sql Server插入方案介绍关于 SqlServer 批量插入的方式,有三种比较常用的插入方式,Insert.BatchInsert.SqlBulkCopy,下面我们对比以下三种方案的速度 ...
java连接mysql批量写入数据
1.采用公认的MYSQL最快批量提交办法 public void index() throws UnsupportedEncodingException, Exception { //1000个一提交 ...
Elasticsearch 5.4.3实战--Java API调用：批量写入数据
这个其实比较简单,直接上代码. 注意部分逻辑可以换成你自己的逻辑 package com.cs99lzzs.elasticsearch.service.imp; import java.sql.Tim ...
使用bulkload向hbase中批量写入数据
1.数据样式写入之前,需要整理以下数据的格式,之后将数据保存到hdfs中,本例使用的样式如下(用tab分开): row1 N row2 M row3 B row4 V row5 N row6 M r ...
python elasticsearch 批量写入数据
from elasticsearch import Elasticsearch from elasticsearch import helpers import pymysql import time ...
Shell脚本:向磁盘中批量写入数据
一.关于本文工作要做的监控系统需要监控磁盘空间的使用率并报警.在测试这个功能的时候需要模拟两个场景:一是磁盘空间不断增长超过设定的阈值时,需要触发报警机制:二是磁盘空间降落到低于报警阈值的时候,不再 ...

随机推荐

解决The valid characters are defined in RFC 7230 and RFC 3986错误问题
分析原因: 导致上述问题是因为tomcat自tomcat 8.0.35版本之后对URL参数做了比较规范的限制,必须遵循RFC 7230 and RFC 3986规范,对于非保留字字符(json格式的请 ...
canvas实例_时钟
效果图:是一个会动的时钟一.时钟的组成 1.表盘(蓝色) 2.刻度(黑色) 3.时针(黑色) 4.分针(黑色) 5.秒针(红色)需美化二.主要应用的技术 Canvas画线 Canv ...
2-7 R语言基础数据框
#数据框 > df <- data.frame(id=c(1,2,3,4),name=c("a","b","c","d ...
CF700E:Cool Slogans(SAM,线段树合并)
Description 给你一个字符串,如果一个串包含两个可有交集的相同子串,那么这个串的价值就是子串的价值+1.问你给定字符串的最大价值子串的价值. Input 第一行读入字符串长度$n$,第二行是 ...
【洛谷P3410】拍照题解（最大权闭合子图总结）
题目描述小B有n个下属,现小B要带着一些下属让别人拍照. 有m个人,每个人都愿意付给小B一定钱让n个人中的一些人进行合影.如果这一些人没带齐那么就不能拍照,小B也不会得到钱. 注意:带下属不是白带的 ...
关于 X509Certificate2 找到文件路径的问题
由于微信退款功能需要用到证书,当调用 X509Certificate2 的时候,会提示找不到文件而报错. X509Certificate2 cert = new X509Certificate2(文件 ...
kubernetes label 标签使用
查看node的标签kubectl get node --show-labels 删除标签kubectl label nodes node5 storagenode- 设置标签kubectl label ...
Python2.7-shelve
shelve模块,持久化对象数据,可以说是 pickle 模块的封装,用于把像字典一样的以键-值存储的数据持久化存储,像操作数据库.当我们写程序的时候如果不想用关系数据库那么重量级的东东去存储数据,不 ...
CentOS7服务器上部署深度/机器学习环境推荐首选anaconda3
CentOS7服务器上部署深度/机器学习环境推荐首选anaconda3,亲测~~ 因为可以创建不同的环境版本或虚拟环境 CentOS7服务器安装anaconda3后,CentOS7服务器开启后自动将a ...
JAVA之多线程概念及其几种实现方法优劣分析
1. 多线程程序:指令集,静态的概念进程:操作系统调动程序,是程序的一次动态执行过程,动态的概念线程:在进程内的多条执行路径 Ps:单核的话进程都是虚拟模拟出来的,多核处理器才可以执行真正的多线 ...

MSSQL批量写入数据方案

MSSQL批量写入数据方案的更多相关文章

随机推荐

热门专题