转载地址：http://blog.csdn.net/chenguanzhou123/article/details/9376537#，如果有侵犯原创，请留言告知，本人会及时删除。

前言

SQLite数据库由于其简单、灵活、轻量、开源，已经被越来越多的被应用到中小型应用中。甚至有人说，SQLite完全可以用来取代c语言中的文件读写操作。因此我最近编写有关遥感数据处理的程序的时候，也将SQLite引入进来，以提高数据的结构化程度，并且提高大数据的处理能力（SQLite最高支持2PB大小的数据）。但是最开始，我发现，直接使用SQL语句的插入效率简直低的令人发指的。后来不断查文档、查资料，才发现了一条快速的“数据插入”之路。本文就以插入数据为例，整合网上和资料书中的各种提高SQLite效率的方法，给出提高SQLite数据插入效率的完整方法。（大神们勿喷）

1 数据

我使用的电脑是Win7 64位系统，使用VC2010编译，SQLIte版本为3.7.15.2 ，电脑CPU为二代i3处理器，内存6G。

实验之前，先建立要插入数据的表:

create table t1 (id integer , x integer , y integer， weight real)

2 慢速——最粗暴的方法

SQLite的API中直接执行SQL的函数是：

int sqlite3_exec( sqlite3*, const char *sql, int (*callback)(void*,int,char**,char**), void *, char **errmsg)

直接使用INSERT语句的字符串进行插入，程序部分代码（完整代码见后文），如下：

for(int i=0;i<nCount;++i)

{

std::stringstream ssm;

ssm<<"insert into t1 values("<<i<<","<<i*2<<","<<i/2<<","<<i*i<<")";

sqlite3_exec(db,ssm.str().c_str(),0,0,0);

}

这个程序运行的太慢了，我已经没时间等待了，估算了一下，基本上是 7.826 条/s

3 中速——显式开启事务

所谓”事务“就是指一组SQL命令，这些命令要么一起执行，要么都不被执行。在SQLite中，每调用一次sqlite3_exec()函数，就会隐式地开启了一个事务，如果插入一条数据，就调用该函数一次，事务就会被反复地开启、关闭，会增大IO量。如果在插入数据前显式开启事务，插入后再一起提交，则会大大提高IO效率，进而加数据快插入速度。

开启事务只需在上述代码的前后各加一句开启与提交事务的命令即可：

sqlite3_exec(db,"begin;",0,0,0);

for(int i=0;i<nCount;++i)

{

std::stringstream ssm;

ssm<<"insert into t1 values("<<i<<","<<i*2<<","<<i/2<<","<<i*i<<")";

sqlite3_exec(db,ssm.str().c_str(),0,0,0);

}

sqlite3_exec(db,"commit;",0,0,0);

显式开启事务后，这个程序运行起来明显快很多，估算效率达到了34095条/s，较原始方法提升约5000倍。

4 高速——写同步(synchronous)

我要使用一个遥感处理算法处理10000*10000的影像，中间有一步需要插入100000000条数据到数据库中，如果按照开启事务后的速度34095条/s，则需要100000000÷34095 = 2932秒 = 48.9分，仍然不能够接受，所以我接着找提升速度的方法。终于，在有关讲解SQLite配置的资料中，看到了“写同步”选项。

在SQLite中，数据库配置的参数都由编译指示（pragma）来实现的，而其中synchronous选项有三种可选状态，分别是full、normal、off。这篇博客以及官方文档里面有详细讲到这三种参数的设置。简要说来，full写入速度最慢，但保证数据是安全的，不受断电、系统崩溃等影响，而off可以加速数据库的一些操作，但如果系统崩溃或断电，则数据库可能会损毁。

SQLite3中，该选项的默认值就是full，如果我们再插入数据前将其改为off，则会提高效率。如果仅仅将SQLite当做一种临时数据库的话，完全没必要设置为full。在代码中，设置方法就是在打开数据库之后，直接插入以下语句：

sqlite3_exec(db,"PRAGMA synchronous = OFF; ",0,0,0);

此时，经过测试，插入速度已经变成了41851条/s，也就是说，插入100000000条数据，需要2389秒 = 39.8分。

5 极速——执行准备

虽然写同步设为off后，速度又有小幅提升，但是仍然较慢。我又一次踏上了寻找提高SQLite插入效率方法的道路上。终于，我发现，SQLite执行SQL语句的时候，有两种方式：一种是使用前文提到的函数sqlite3_exec()，该函数直接调用包含SQL语句的字符串；另一种方法就是“执行准备”（类似于存储过程）操作，即先将SQL语句编译好，然后再一步一步（或一行一行）地执行。如果采用前者的话，就算开起了事务，SQLite仍然要对循环中每一句SQL语句进行“词法分析”和“语法分析”，这对于同时插入大量数据的操作来说，简直就是浪费时间。因此，要进一步提高插入效率的话，就应该使用后者。

“执行准备”主要分为三大步骤：

1.调用函数

int sqlite3_prepare_v2( sqlite3 *db, const char *zSql, int nByte, sqlite3_stmt **ppStmt, const char **pzTail);

并且声明一个指向sqlite3_stmt对象的指针，该函数对参数化的SQL语句zSql进行编译，将编译后的状态存入ppStmt中。

2.调用函数 sqlite3_step() ，这个函数就是执行一步（本例中就是插入一行），如果函数返回的是SQLite_ROW则说明仍在继续执行，否则则说明已经执行完所有操作；

3.调用函数 sqlite3_finalize()，关闭语句。

关于执行准备的API的具体语法，详见官方文档。本文中执行准备的c++代码如下：

sqlite3_exec(db,"begin;",0,0,0);

sqlite3_stmt *stmt;

const char* sql = "insert into t1 values(?,?,?,?)";

sqlite3_prepare_v2(db,sql,strlen(sql),&stmt,0);

for(int i=0;i<nCount;++i)

{

sqlite3_reset(stmt);

sqlite3_bind_int(stmt,1,i);

sqlite3_bind_int(stmt,1,i*2);

sqlite3_bind_int(stmt,1,i/2);

sqlite3_bind_double(stmt,1,i*i);

}

sqlite3_finalize(stmt);

sqlite3_exec(db,"commit;",0,0,0);

此时测试数据插入效率为：265816条/s，也就是说，插入100000000条数据，需要376秒 = 6.27分。这个速度已经很满意了。

6 总结

综上所述啊，SQLite插入数据效率最快的方式就是：事务+关闭写同步+执行准备（存储过程），如果对数据库安全性有要求的话，就开启写同步。

参考资料：

1. SQLite官方文档：http://www.sqlite.org/docs.html

2.《解决sqlite3插入数据很慢的问题》：http://blog.csdn.net/victoryknight/article/details/7461703

3.《The Definitive Guide to SQLite》Apress出版：http://www.apress.com/9781430232254 （这是本好书）

附最终完整代码:

#include <iostream>

#include <string>

#include <sstream>

#include <time.h>

#include "sqlite3.h"

const int nCount = 500000;

int main (int argc,char** argv)

{

sqlite3* db;

sqlite3_open("testdb.db" ,&db);

sqlite3_exec(db,"PRAGMA synchronous = OFF; ",0,0,0);

sqlite3_exec(db,"drop table if exists t1",0,0,0);

sqlite3_exec(db,"create table t1(id integer,x integer,y integer ,weight real)",0,0,0);

clock_t t1 = clock();

sqlite3_exec(db,"begin;",0,0,0);

sqlite3_stmt *stmt;

const char* sql = "insert into t1 values(?,?,?,?)";

sqlite3_prepare_v2(db,sql,strlen(sql),&stmt,0);

for(int i=0;i<nCount;++i)

{

// std::stringstream ssm;

// ssm<<"insert into t1 values("<<i<<","<<i*2<<","<<i/2<<","<<i*i<<")";

// sqlite3_exec(db,ssm.str().c_str(),0,0,0);

sqlite3_reset(stmt);

sqlite3_bind_int(stmt,1,i);

sqlite3_bind_int(stmt,2,i*2);

sqlite3_bind_int(stmt,3,i/2);

sqlite3_bind_double(stmt,4,i*i);

sqlite3_step(stmt);

}

sqlite3_finalize(stmt);

sqlite3_exec(db,"commit;",0,0,0);

clock_t t2 = clock();

sqlite3_close(db);

std::cout<<"cost tima: "<<(t2-t1)/1000.<<"s"<<std::endl;

return 0;

}

[转载]提升SQLite数据插入效率低、速度慢的方法的更多相关文章

提升SQLite数据插入效率低、速度慢的方法
前言 SQLite数据库由于其简单.灵活.轻量.开源,已经被越来越多的被应用到中小型应用中.甚至有人说,SQLite完全可以用来取代c语言中的文件读写操作.因此我最近编写有关遥感数据处理的程序的时候, ...
提升SQLite数据插入效率低、速度慢的方法(转)
前言 SQLite数据库由于其简单.灵活.轻量.开源,已经被越来越多的被应用到中小型应用中.甚至有人说,SQLite完全可以用来取代C语言中的文件读写操作.因此我最近编写有关遥感数据处理的程序的时候, ...
提升R代码运算效率的11个实用方法
提升R代码运算效率的11个实用方法众所周知,当我们利用R语言处理大型数据集时,for 循环语句的运算效率非常低.有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升.本文将 ...
MFC使用SQLite 学习系列二：无法容忍的数据插入效率
上一篇随笔中,介绍了,基本的使用没什么问题了,那么开始数据的插入. 一问题--无法容忍的插入效率代码写入基本完成,然后开始测试.起初,插入数据的时候基本上是插入每次插入9组数据,看不出来数据插入的 ...
提升R代码运算效率的11个实用方法——并行、效率
转载于36大数据,原文作者:Selva Prabhakaran 译者:fibears 众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低.有许多种方法可以提升你的代码运算效率 ...
【R】提升R代码运算效率的11个实用方法
低.有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升.本文将介绍几种适用于大数据领域的方法,包括简单的逻辑调整设计.并行处理和Rcpp的运用,利用这些方法你可以轻松地处理 ...
解决 C++ 操作 MySQL 大量数据插入效率低下问题
往 Mysql 中,插入10000条简单数据.速度很缓慢,竟然要5分钟左右, 可是打开事务的话.一秒不到就搞定了代码: #include <iostream> #include < ...
C++操作MySQL大量数据插入效率低下的解决方法
#include <iostream> #include <winsock2.h> #include <string> #include "mysql.h ...
android sqlite批量插入数据速度解决方案
转自 http://hi.baidu.com/hfutonline/blog/item/62b1e4de8bdf4b2e5882dd28.html 最近在做android项目的时候遇到一个问题,应用程 ...

随机推荐

NOIP 模拟 $31\; \rm Game$
题解很容易求出在没有字典序最大的限制条件下的最多胜利场数. 这样就可以对于每一位放最优的解,怎么做,二分答案. 分两种情况,一种是当前一位是输的,一种是赢的,复杂度 \(\mathcal O(\rm ...
NOIP 模拟 $12\; \text{简单的区间}$
题解签到题求区间和为 $k$ 的倍数的区间,我们可以转化为求左右两个端点,其前缀和相等对于区间最大值,我们可以把其转化为一个值,它能向左,向右扩展的最远边界,一个单调栈即可我们设一个值 \ ...
第一次上传代码到gitee
初始化 git init 添加文件到本地仓库 git add . 提交文件到本地仓库 git remote add origin 仓库地址拉去远程仓库代码 git pull origin maste ...
java 将字符串拆分成块装数组
split 将字符串拆分 regex=???,根据???以其为界进行拆分. public String[] split(String regex) 根据给定正则表达式的匹配拆分此字符串. 该方法的作用 ...
session.flush与transaction.commit
以session的save方法为例来看一个简单.完整的事务流程,如下是代码片段: ---------------------------- Session session = sessionFacto ...
GO的GC辣鸡回收（一）
用户程序通过内存分配器(Allocator)在堆上申请内存,而垃圾收集器(Collector)负责回收堆上的内存空间,内存分配器和垃圾收集器共同管理程序中的堆内存空间. 基本概念垃圾分类语义垃圾: ...
（1）RabbitMQ在Docker上安装
1.简介在来学习RabbitMQ时候,我觉得很有必要先把它的环境先搭建起来,这样后面的示例才能进行.因为之前自己手动在Linux服务器上搭建过Elasticsearch,当时踩过太多坑了,浪费太多时 ...
洛谷P2338 Bessie Slows Down S 题解
题目 [USACO14JAN]Bessie Slows Down S 题解这道题其实蛮简单的,不知道为什么难度划到了提高+,个人觉得这难度大概就是普及左右. 具体说说怎么做吧,简单模拟一下即可,始终 ...
Docker之Alpine制作jre镜像（瘦身）+自定义镜像上传阿里云
alpine制作jdk镜像 alpine Linux简介 1.Alpine Linux是一个轻型Linux发行版,它不同于通常的Linux发行版,Alpine采用了musl libc 和 BusyBo ...
adb 常用命令大全（1）- 汇总
adb 常用命令大全系列基础命令查看手机设备信息应用管理日志相关模拟按键输入其他实用功能

[转载]提升SQLite数据插入效率低、速度慢的方法

转载地址：http://blog.csdn.net/chenguanzhou123/article/details/9376537#，如果有侵犯原创，请留言告知，本人会及时删除。

前言

1 数据

2 慢速——最粗暴的方法

[转载]提升SQLite数据插入效率低、速度慢的方法的更多相关文章

随机推荐

热门专题