关于vector push_back()与其他方式读取数据的效率对比

引言：
在读取大量数据（数组）时，使用vector会尽量保证不会炸空间（MLE），但是相比于scanf的读取方式会慢上不少。但到底效率相差有多大，我们将通过对比测试得到结果。

测试数据：利用srand()函数生成1e7的随机数组（x[i] ∈ (0, 115000]），最终结果将是读取这1e7（一千万）的数组所消耗的时间。

测试环境：在Linux虚拟机下测试，利用编译命令：time ./t得到运行时间。

备注：在debug模式下运行，不开任何优化。

生成数据代码：

#include <bits/stdc++.h>

using namespace std;

const int maxn = 10000005, lenth = 115000;

int n, x, y;

int main()

{

    freopen("test.in", "w", stdout);

    cout << maxn << endl;

    srand((unsigned int) time(0));

    for(int i = 0; i != maxn; ++i)

    {

        x = rand()%lenth+1;

        cout << x << endl;

    }

    fclose(stdout);

    return 0;

}

对比读入：
1.正常使用push_back()读入

for(int i = 0; i != n; ++i)

{

    scanf("%d", &curr);

    q1.push_back(curr);

}

2.每次空间不够时将vector数组增大空间

void test_resize(int a)

{

    if(num == size_2-1)

    {

        q2.resize(size_2 += 10000);

    }

    q2[++num] = a;

    return ;

}

for(int i = 0; i != n; ++i)//main函数中

{

    scanf("%d", &curr);

    test_resize(curr);

}

3.scanf读入

for(int i = 0; i != n; ++i)//main函数中

{

    scanf("%d", &x[i]);

}

4.读入优化

int read()

{

    input = 0;

    a = getchar();

    while(a < '0' || a > '9')

        a = getchar();

    while(a >= '0' && a <= '9')

    {

        input = input*10+a-'0';

        a = getchar();

    }

    return input;

}

for(int i = 0; i != n; ++i)

{

    x[i] = read();

}

5.读入优化+resize()，再扔入vector数组

void test_resize(int a)

{

    if(num == size_2-1)

    {

        q2.resize(size_2 += 10000);

    }

    q2[++num] = a;

    return ;

}

int read()

{

    input = 0;

    a = getchar();

    while(a < '0' || a > '9')

        a = getchar();

    while(a >= '0' && a <= '9')

    {

        input = input*10+a-'0';

        a = getchar();

    }

    return input;

}

for(int i = 0; i != n; ++i)

{

    curr = read();

    test_resize(curr);

}

测试结果：
1.push_back()读入

real    0m2.046s

user    0m1.620s

sys 0m0.428s

2.resize()后再读入

real    0m1.743s

user    0m1.636s

sys 0m0.104s

3.scanf读入

real    0m1.885s

user    0m1.776s

sys 0m0.108s

4.读入优化

real    0m0.996s

user    0m0.948s

sys 0m0.044s

5.读入优化+resize，再扔入vector数组

real    0m1.121s

user    0m1.036s

sys 0m0.084s

读入优化一骑绝尘，读入优化+resize位居第二，scanf和resize大致相当，push_back()最慢。

结论：
当数据范围很大的时候，建议使用vector的resize(lenth)+读入优化的方式进行读取，这样既最大限度降低了内存的浪费，又保证了不会在读入上花费太久。

完整测试程序：

#include <bits/stdc++.h>

using namespace std;

#define maxn 10000005

vector<int> q1, q2, q3;

int n, curr, num = -1, size_1, size_2;

int x[maxn], input;

char a;

void test_resize(int a)

{

    if(num == size_2-1)

    {

        q2.resize(size_2 += 10000);

    }

    q2[++num] = a;

    return ;

}

int read()

{

    input = 0;

    a = getchar();

    while(a < '0' || a > '9')

        a = getchar();

    while(a >= '0' && a <= '9')

    {

        input = input*10+a-'0';

        a = getchar();

    }

    return input;

}

int main()

{

    freopen("test.in", "r", stdin);

    scanf("%d", &n);

    for(int i = 0; i != n; ++i)

    {

        //x[i] = read();

        //curr = read();

        //test_resize(curr);

        //scanf("%d", &x[i]);

        //scanf("%d", &curr);

        //test_resize(curr);

        //q3.push_back(curr);

    }

    return 0;

}

测试自此结束。
箜瑟_qi 2017.04.07 13:55

关于vector push_back()与其他方式读取数据的效率对比的更多相关文章

关于vector push_back()与其他方式读取数据的效率对比（转）
引言: 在读取大量数据(数组)时,使用vector会尽量保证不会炸空间(MLE),但是相比于scanf的读取方式会慢上不少.但到底效率相差有多大,我们将通过对比测试得到结果. 测试数据:利用srand ...
EF 数据查询效率对比
优化的地方: 原地址:https://www.cnblogs.com/yaopengfei/p/9226328.html ①:如果仅是查询数据,并不对数据进行增.删.改操作,查询数据的时候可以取消状态 ...
Tensorflow中使用tfrecord方式读取数据-深度学习-周振洋
本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释.并且本博客主要以图片数据为例进行介绍,如有错误,敬请斧正. 使用Tensorflow训练神经网络时,我们可以用 ...
iNeuOS工业互联平台，增加OPC UA驱动，同步和订阅方式读取数据
目录 1. 概述... 1 2. 平台演示... 2 3. OPC UA应用效果... 2 1. 概述最近的项目,用户需要使用OPC UA读取数据,通 ...
Java使用JDBC连接数据库逐条插入数据、批量插入数据、以及通过SQL语句批量导入数据的效率对比
测试用的示例java代码: package com.zifeiy.test.normal; import java.io.File; import java.io.FileOutputStream; ...
云端TensorFlow读取数据IO的高效方式
低效的IO方式最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...
[置顶] 云端TensorFlow读取数据IO的高效方式
低效的IO方式最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...
SparkStreaming直连方式读取kafka数据，使用MySQL保存偏移量
SparkStreaming直连方式读取kafka数据,使用MySQL保存偏移量 1. ScalikeJDBC 2.配置文件 3.导入依赖的jar包 4.源码测试通过MySQL保存kafka的偏移量 ...
Oracle中读取数据一些原理研究
文章很多摘录了 http://blog.163.com/liaoxiangui@126/blog/static/7956964020131069843572/ 同时基于这篇文章的基础上,补充一些学习要 ...

随机推荐

windows系统解决github.com访问超时
当github无法访问时,可以尝试在hosts文件中添加下面的内容 windows:c:\windows\system32\drivers\etc 192.30.252.131 https://git ...
javascript 数组的部分常用属性用法
数组检测数组(返回布尔类型 a. instanceof(); 检测是否是数组对象 console.log(arr instanceof Array) ; b. Array.isArray() ,H5 ...
豆瓣电影Top250基本信息抓取
豆瓣电影Top250基本信息抓取最近想看电影,但是想看一些有营养的,所以就去豆瓣上看电影评分,但是豆瓣上的评分没有排序,所以就用python把网站内容爬下来了,然后按评分做了排序.具体代码参见git ...
老李分享：loadrunne动态查询db2数据库
老李分享:loadrunne动态查询db2数据库 poptest老李认为性能测试脚本开发不仅仅涉及到脚本开发的技术层面,同时也要对一些其他技术有所了解动态链接库的技术,线程安全等等,建议在做下面的 ...
selenium实例：unittest框架+PO开发模式
这是<selenium2+python学习总结>的升级版. 1. 项目结构 2. 项目代码 1) globalparameter.py # ...
个人认为最好的Mac端的视频播放软件___movist
http://pan.baidu.com/s/1kVm0Zmn password : y9rn 点击打开链接 http://pan.baidu.com/s/1i4ABval password :kt3 ...
Linux上常用的文件传输方式以及比较
tp ftp 命令使用文件传输协议(File Transfer Protocol, FTP)在本地主机和远程主机之间或者在两个远程主机之间进行文件传输. FTP 协议允许数据在不同文件系统的主机之间传 ...
谱聚类（Spectral clustering）分析（1）
作者:桂. 时间:2017-04-13 19:14:48 链接:http://www.cnblogs.com/xingshansi/p/6702174.html 声明:本文大部分内容来自:刘建平Pi ...
mvc中DotNetOpenAuth实现了第三方应用访问自己的网站
以yahoo为例吧,即从yahoo取得用户信息,存到自己的站点,实现了用户信息在一次录入多处共享的功能.以下是在点击了使用yahoo登录本站的链接后执行action:OpenId. ProviderU ...
有关 json对象取出其中数据问题
这几天,在做一个ajax异步提交的小功能,发现从ashx中传递过来的string 类型的数据,一直拿不到(当时是指的是json点不出来),傻傻的自己,一直在找其他的方法,看看其他那里出了错误,最后,那 ...

关于vector push_back()与其他方式读取数据的效率对比

关于vector push_back()与其他方式读取数据的效率对比的更多相关文章

随机推荐

热门专题