一次性事务和CTE插入数据的比较

有时要构造一些数据来做测试数据，像下面这样：

IF OBJECT_ID(N'T14') IS NOT NULL

BEGIN

    DROP TABLE T14

END

GO

CREATE TABLE T14 (t14_id INT)

GO

DECLARE @i INT = 1

WHILE @i <= 1000

BEGIN

    INSERT INTO T14 (t14_id)

    SELECT @i

    SET @i = @i + 1

END

GO

code-1

这里存在一个问题，每运行一次insert相当于commit了一次事务，数据量小的还不会出现问题，如果把要插入100万，200万，1000万甚至更多的数据呢？既然insert语句是隐式commit的，在这个循环外面加一个显式的事务，即可显著提高插入的性能。另一种方法就是使用CTE也可以一次把数据插入到表中，从而提高性能。现在就这两种方法插入数据的性能来做一个比较。没有结果之前，猜猜哪种速度更快？或者两者差不多？

首先是加事务，插入100万条记录：

IF OBJECT_ID(N'T14') IS NOT NULL

BEGIN

    DROP TABLE T14

END

GO

CREATE TABLE T14 (t14_id INT)

GO

DBCC FREESESSIONCACHE

DBCC DROPCLEANBUFFERS

GO

SET NOCOUNT ON;

BEGIN TRAN

DECLARE @i INT = 1

WHILE @i <= 1000000

BEGIN

    INSERT INTO T14 (t14_id)

    SELECT @i

    SET @i = @i + 1

END

COMMIT TRAN;

SET NOCOUNT OFF;

GO

code-2

我的机器上测试多次，取平均值，大概使用了22秒即可完成100万条记录的插入，速度还是挺快的。（如果没有加显式事务，要多久才能完成呢？有兴趣的朋友可以试下）

下面是使用CTE：

IF OBJECT_ID(N'T15') IS NOT NULL

BEGIN

    DROP TABLE T15

END

GO

CREATE TABLE T15 (t15_id INT)

GO

DBCC FREESESSIONCACHE

DBCC DROPCLEANBUFFERS

GO

WITH CTE1 AS (

SELECT a.[object_id] FROM master.sys.all_objects AS a, master.sys.all_objects AS b

)

,CTE2 AS (

SELECT ROW_NUMBER() OVER (ORDER BY [object_id]) as row_no FROM CTE1

)

INSERT INTO T15 (t15_id)

SELECT row_no  FROM CTE2 WHERE row_no <= 1000000

GO

code-3

也是测试多次取平均值，竟然是5秒左右就完成，大大出乎我的意料！现在改为插入1000万条记录，看结果如何。前者只需把code-2中的1000000修改为10000000，再运行即可。后者由于CTE1的记录数不够，需要UNION ALL两次，代码如下：

IF OBJECT_ID(N'T15') IS NOT NULL

BEGIN

    DROP TABLE T15

END

GO

CREATE TABLE T15 (t15_id INT)

GO

DBCC FREESESSIONCACHE

DBCC DROPCLEANBUFFERS

GO

WITH CTE1 AS (

SELECT a.[object_id] FROM master.sys.all_objects AS a, master.sys.all_objects AS b

UNION ALL

SELECT a.[object_id] FROM master.sys.all_objects AS a, master.sys.all_objects AS b

UNION ALL

SELECT a.[object_id] FROM master.sys.all_objects AS a, master.sys.all_objects AS b

)

,CTE2 AS (

SELECT ROW_NUMBER() OVER (ORDER BY [object_id]) as row_no FROM CTE1

)

INSERT INTO T15 (t15_id)

SELECT row_no  FROM CTE2 WHERE row_no <= 10000000

GO

code-4

测试结果：加事务的插入大概需要3分多钟，而CTE则不超过1分半钟的时间就完成了。看来还是CTE更高效啊！在测试过程中，发现内存的使用量不多，但CPU的使用有较明显的提高。此外，插入大数据到表中，有无索引和日志恢复模式也会影响插入的性能。

-------补充-----
这里补充一下CTE1中记录数的生成。如果只需要100万的数据量，只需要master.sys.databases表CROSS JOIN自己一次就可以了，或者找两张表CROSS JOIN后数据更接近的所需就更好了，不够的可以UNIONL ALL几次。那如果需要1000万或更大的记录数，可以在此基础上再CROSS JOIN一次一张小表，比如：

;WITH CTE3 AS (

SELECT a.[object_id] FROM master.sys.all_objects AS a, master.sys.all_objects AS b, master.sys.databases AS c

)

SELECT COUNT(*) AS counts,LEN(COUNT(*)) AS counts_length FROM CTE3

GO

code-5

figure-1

我的机器上生成了1亿1多千万条记录。

一次性事务和CTE插入数据的比较的更多相关文章

（C#版本）提升SQlite数据库效率——开启事务，极速插入数据，3秒100万，32秒1000万条数据
SQLite插入数据效率最快的方式就是:开启事务 + insert语句 + 关闭事务(提交) 利用事务的互斥性,如果在批量的插入操作前显式地开启一次事务,在插入操作结束后,提交事务,那么所有 ...
普通的jdbc事务在插入数据后下面的代码报错时数据不会回滚但是 spring的事务会回滚
普通的jdbc事务在插入数据后下面的代码报错时数据不会回滚但是 spring的事务会回滚
使用事务和SqlBulkCopy批量插入数据
SqlBulkCopy是.NET Framework 2.0新增的类,位于命名空间System.Data.SqlClient下,主要提供把其他数据源的数据有效批量的加载到SQL Server表中的功能 ...
C#使用SqlTransaction事务回滚与SqlBulkCopy批量插入数据
C#中批量处理数据,有时候因为一条记录导致整个批量处理失败.这时候肯能会导致数据不全等问题,这时候我们可以使用SqlTransaction来进行事务回滚,即是要么全部成功要么全部不成功.如下代码 // ...
【Update】C# 批量插入数据 SqlBulkCopy
SqlBulkCopy的原理就是通过在客户端把数据都缓存在table中,然后利用SqlBulkCopy一次性把table中的数据插入到数据库中. SqlConnection sqlConn = new ...
C#批量插入数据到Sqlserver中的四种方式
我的新书ASP.NET MVC企业级实战预计明年2月份出版,感谢大家关注! 本篇,我将来讲解一下在Sqlserver中批量插入数据. 先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的 ...
C#_批量插入数据到Sqlserver中的四种方式
先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快的,因为你生成一个GUID算法所花的时间肯定比你从数据表中重新查询上一条记 ...
C# 之批量插入数据到 SQLServer 中
创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快.而如果存在索引的情况下,每次插入记录都会进行索引重建,这是非常耗性能的.如 ...
C#批量插入数据到Sqlserver中的四种方式 - 转
先创建一个用来测试的数据库和表,为了让插入数据更快,表中主键采用的是GUID,表中没有创建任何索引.GUID必然是比自增长要快的,因为你生成一个GUID算法所花的时间肯定比你从数据表中重新查询上一条记 ...

随机推荐

POJ 1273 Drainage Ditches题解——S.B.S.
Drainage Ditches Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 67823 Accepted: 2620 ...
UVA - 11584 Partitioning by Palindromes[序列DP]
UVA - 11584 Partitioning by Palindromes We say a sequence of char- acters is a palindrome if it is t ...
event.srcElement ，event.fromElement，event.toElement
自然,我们都习惯了 IE,在 IE 中要在函数中获得各事件对象很容易,直接用 event.event.srcElemtn.event.fromElement.event.toElement 就行了.在 ...
基于webmagic的爬虫项目经验小结
大概在1个月前,利用webmagic做了一个爬虫项目,下面是该项目的一些个人心得,贴在这里备份: 一.为什么选择webmagic? 说实话,开源的爬虫框架已经很多了,有各种语言(比如:python.j ...
Linux下MySQL/MariaDB Galera集群搭建过程
MariaDB介绍 MariaDB是开源社区维护的一个MySQL分支,由MySQL的创始人Michael Widenius主导开发,采用GPL授权许可证. MariaDB的目的是完全兼容MySQL,包 ...
FineUI小技巧（5）向子窗口传值，向父窗口传值
前言 FineUI中经常会用到启用IFrame的Window控件,这样有助于从物理上进行代码解耦和.IFrame的引入就会涉及传值问题,如何在父窗口和子窗口之间相互传值呢? 向子窗口传值向子窗口传值 ...
基于C/S架构的3D对战网络游戏C++框架_02系统设计（总体设计、概要设计）
本系列博客主要是以对战游戏为背景介绍3D对战网络游戏常用的开发技术以及C++高级编程技巧,有了这些知识,就可以开发出中小型游戏项目或3D工业仿真项目. 笔者将分为以下三个部分向大家介绍(每日更新): ...
【跟着子迟品 underscore】常用类型判断以及一些有用的工具方法
Why underscore 最近开始看 underscore.js 源码,并将 underscore.js 源码解读放在了我的 2016 计划中. 阅读一些著名框架类库的源码,就好像和一个个大师对 ...
格雷码原理与Verilog实现
格雷码原理格雷码是一个叫弗兰克*格雷的人在1953年发明的,最初用于通信.格雷码是一种循环二进制码或者叫作反射二进制码.格雷码的特点是从一个数变为相邻的一个数时,只有一个数据位发生跳变,由于这种特点 ...
一行代码解决ie6,7,8,9,10兼容性问题
"浏览器模式"."文档模式"选项的区别如下: 1."浏览器模式"用于切换IE针对该网页的默认文档模式.对不同版本浏览器的条件备注解析.发送给 ...

一次性事务和CTE插入数据的比较

一次性事务和CTE插入数据的比较的更多相关文章

随机推荐

热门专题