batch insert 1 million datas into mysql

最近尝试插入1百万条数据进db，以mysql为例。

1. 顺序insert

先写了个无脑的for循环作为base-line，插1万条耗时1m53s，根本不敢插1百万。

foreach(var student in students){

    var sql = string.Format("insert into student ... ");

    cmd.CommandText = sql;

    cmd.ExecuteNonQuery();

}

2. batch insert

上面这种方式有2个问题：

在DB端，每次执行都会以1个单独的事务执行；
在网络上，传输的次数过多、每次传输的效率较差。

相应的解决方法是：

在执行前后套BeginTransaction/Commit，保证所有的insert都是在一个大事务里； // 光是这样，1万条只要不到2s，1百万条只要75s
每1万条数据，拼接成1个大sql，只要不超过 max_allowed_packet=1M 的默认限制即可。具体多少行拼成1条，视字段多少而定，拼成的sql如下。 // 这样的效果也很显著，1百万条只要13s
```
 insert into table (fields...) values (1...), (2...), ... , (10000...);
```
可以修改mysql的默认设置，在my.ini里添加如下配置。但试下来效果并不明显，改成10M、每次拼接10万条数据，总时间仍为13s，可以想见这时瓶颈已经不是传输时间了，而是对表的操作。
```
 [mysqld]

 max_allowed_packet=10M // 1M default
```

3. MultiThread insert

试了下在方法2(batch insert)的基础上，采用4个线程同时insert，1百万条数据耗时16s，反而慢了。估计时间都耗在创建connection、单表加锁上了。在这个场景下，MultiThread对解决问题无益。

4. ibdata1无限增长的问题

每个Student对象大约是50字节，每insert1百万大约是50M。多insert几次后执行删除操作，发现ibdata1文件反而接近翻倍的增长。解决方法如下：

关闭mysqld服务
删除ibdata1、ib_logfile0/1、对应的database文件夹
my.ini的[mysqld]里添加 innodb_file_per_table=1 ，这样就会给每个表创建一个单独的ibd文件

最后是Demo的源码，如果你有更快的方法，不妨留言~

batch insert 1 million datas into mysql的更多相关文章

使用batch insert解决MySQL的insert吞吐量问题
最近使用了一个非常简单易用的方法解决了业务上的一个insert吞吐量的问题,在此总结一下. 首先我们明确一下,insert吞吐量其实并不是指的IPS(insert per second),而是指的RP ...
oracle中的insert all into，在mysql中的写法
oracle中的insert all into表示插入多条数据,mysql中可以采用: INSERT INTO表名(字段1,字段2..) values <foreach collection=& ...
【Insert】使用java对mysql数据库进行插入操作
//插入100条数据package database; import java.sql.Connection; import java.sql.DriverManager; import java.s ...
简单的sqlserver批量插入数据easy batch insert data use loop function in sqlserver
--example 1: DECLARE @pid INT,@name NVARCHAR(50),@level INT,@i INT,@column2 INT SET @pid=0 SET @name ...
【java】[sql]使用Java程序向MySql数据库插入一千万条记录，各种方式的比较，最后发现insert批量插入方式对效率提升最明显
我的数据库环境是mysql Ver 14.14 Distrib 5.6.45, for Linux (x86_64) using EditLine wrapper 这个数据库是安装在T440p的虚拟机 ...
MySQL中的insert ignore into, replace into等的一些用法总结
在MySQL中进行条件插入数据时,可能会用到以下语句,现小结一下.我们先建一个简单的表来作为测试: CREATE TABLE `books` ( `id` INT(11) NOT NULL AUTO_ ...
MySQL中的insert ignore into, replace into等的一些用法小结（转）
MySQL中的insert ignore into, replace into等的一些用法总结(转) 在MySQL中进行条件插入数据时,可能会用到以下语句,现小结一下.我们先建一个简单的表来作为测试: ...
mysql插入记录INSERT与多表更新
1.第一种:INSERT [INTO] tbl_name[ (col_name, ... ) ] {VALUES | VALUE}({expr |default}, ... ), (...), .. ...
MySQL中的insert ignore into, replace into用法总结
MySQL replace into 有三种形式: 1. replace into tbl_name(col_name, ...) values(...) 2. replace into tbl_na ...

随机推荐

hdu 1081(最大子矩阵和)
题目很简单,就是个最大子矩阵和的裸题,看来算法课本的分析后也差不多会做了.利用最大子段和的O(n)算法,对矩阵的行(或列)进行 i和j的枚举,对于第 i到j行,把同一列的元素进行压缩,得到一整行的一维 ...
Java Performance - 优化和分析Garbage Collection/垃圾收集
随着硬件的不断提升,Java Heap 越来越大,合理的垃圾收集调优变得愈发重要.下面介绍一些最佳实践: 注意: 下面不涉及 IBM AIX Java. 同时不介绍原理,仅仅是建议以及初始配置/最佳实 ...
Java 默认/缺省 server 还是 client 模式
不多说,复制官方文档,适用于 Java 5 6 7 Architecture OS Default client VM if server-class, server VM; otherwise, c ...
Eclipse远程调试出现“JDWP Transport dt_socket failed to initialize”的解决方案
欢迎关注我的社交账号: 博客园地址: http://www.cnblogs.com/jiangxinnju/p/4781259.html GitHub地址: https://github.com/ji ...
【Problem solved】发现输入法都是仅桌面使用，无法输入中文时
你打开命令提示符输入CTFMON就可以啦.
angular 模板小例子
参考网站:https://docs.angularjs.org/tutorial/step_09 先看下目录结构新建个空文件夹, 输入命令: express --view ejs cnpm inst ...
socket头文件
一. 三种类型的套接字:1.流式套接字(SOCKET_STREAM) 提供面向连接的可靠的数据传输服务.数据被看作是字节流,无长度限制.例如FTP协议就采用这种.2.数据报式套接字(SOCKET ...
hdu---(1800)Flying to the Mars(trie树)
Flying to the Mars Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Other ...
WebForm MapPageRoute 路由配置(转载)
使用场景是:MVC 混合使用 WebForm,然后对 WebForm 进行路由配置 http://www.cnblogs.com/xishuai/archive/2015/02/26/web-form ...
51nod 1613翻硬币
题目链接:51nod 1613 翻硬币知乎上的理论解法http://www.zhihu.com/question/26570175/answer/33312310 本题精髓在于奇偶性讨论. 若 n ...