引言: 
在读取大量数据(数组)时,使用vector会尽量保证不会炸空间(MLE),但是相比于scanf的读取方式会慢上不少。但到底效率相差有多大,我们将通过对比测试得到结果。

测试数据:利用srand()函数生成1e7的随机数组(x[i] ∈ (0, 115000]),最终结果将是读取这1e7(一千万)的数组所消耗的时间。

测试环境:在Linux虚拟机下测试,利用编译命令:time ./t得到运行时间。

备注:在debug模式下运行,不开任何优化。

生成数据代码:

 #include <bits/stdc++.h>
using namespace std; const int maxn = , lenth = ; int n, x, y; int main()
{
freopen("test.in", "w", stdout); cout << maxn << endl;
srand((unsigned int) time());
for(int i = ; i != maxn; ++i)
{
x = rand()%lenth+;
cout << x << endl;
} fclose(stdout);
return ;
}

对比读入: 
1.正常使用push_back()读入

 for(int i = ; i != n; ++i)
{
scanf("%d", &curr);
q1.push_back(curr);
}

2.每次空间不够时将vector数组增大空间

 void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} for(int i = ; i != n; ++i)//main函数中
{
scanf("%d", &curr);
test_resize(curr);
}

3.scanf读入

 for(int i = ; i != n; ++i)//main函数中
{
scanf("%d", &x[i]);
}

4.读入优化

 int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
}
for(int i = ; i != n; ++i)
{
x[i] = read();
}

5.读入优化+resize(),再扔入vector数组

 void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
} for(int i = ; i != n; ++i)
{
curr = read();
test_resize(curr);
}

测试结果: 
1.push_back()读入

real    0m2.046s
user 0m1.620s
sys 0m0.428s

2.resize()后再读入

real    0m1.743s
user 0m1.636s
sys 0m0.104s

3.scanf读入

real    0m1.885s
user 0m1.776s
sys 0m0.108s

4.读入优化

real    0m0.996s
user 0m0.948s
sys 0m0.044s

5.读入优化+resize,再扔入vector数组

real    0m1.121s
user 0m1.036s
sys 0m0.084s

读入优化一骑绝尘,读入优化+resize位居第二,scanf和resize大致相当,push_back()最慢。


结论: 
当数据范围很大的时候,建议使用vector的resize(lenth)+读入优化的方式进行读取,这样既最大限度降低了内存的浪费,又保证了不会在读入上花费太久


完整测试程序:

 #include <bits/stdc++.h>
using namespace std;
#define maxn 10000005 vector<int> q1, q2, q3;
int n, curr, num = -, size_1, size_2;
int x[maxn], input;
char a; void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
} int main()
{
freopen("test.in", "r", stdin);
scanf("%d", &n);
for(int i = ; i != n; ++i)
{
//x[i] = read();
//curr = read();
//test_resize(curr);
//scanf("%d", &x[i]);
//scanf("%d", &curr);
//test_resize(curr);
//q3.push_back(curr);
}
return ;
}

转自:http://blog.csdn.net/kongse_qi/article/details/69526418

关于vector push_back()与其他方式读取数据的效率对比(转)的更多相关文章

  1. 关于vector push_back()与其他方式读取数据的效率对比

    引言: 在读取大量数据(数组)时,使用vector会尽量保证不会炸空间(MLE),但是相比于scanf的读取方式会慢上不少.但到底效率相差有多大,我们将通过对比测试得到结果. 测试数据:利用srand ...

  2. EF 数据查询效率对比

    优化的地方: 原地址:https://www.cnblogs.com/yaopengfei/p/9226328.html ①:如果仅是查询数据,并不对数据进行增.删.改操作,查询数据的时候可以取消状态 ...

  3. Tensorflow中使用tfrecord方式读取数据-深度学习-周振洋

    本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释.并且本博客主要以图片数据为例进行介绍,如有错误,敬请斧正. 使用Tensorflow训练神经网络时,我们可以用 ...

  4. iNeuOS工业互联平台,增加OPC UA驱动,同步和订阅方式读取数据

    目       录 1.      概述... 1 2.      平台演示... 2 3.      OPC UA应用效果... 2 1.   概述 最近的项目,用户需要使用OPC UA读取数据,通 ...

  5. Java使用JDBC连接数据库逐条插入数据、批量插入数据、以及通过SQL语句批量导入数据的效率对比

    测试用的示例java代码: package com.zifeiy.test.normal; import java.io.File; import java.io.FileOutputStream; ...

  6. 云端TensorFlow读取数据IO的高效方式

    低效的IO方式 最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...

  7. [置顶] 云端TensorFlow读取数据IO的高效方式

    低效的IO方式 最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...

  8. SparkStreaming直连方式读取kafka数据,使用MySQL保存偏移量

    SparkStreaming直连方式读取kafka数据,使用MySQL保存偏移量 1. ScalikeJDBC 2.配置文件 3.导入依赖的jar包 4.源码测试 通过MySQL保存kafka的偏移量 ...

  9. Oracle中读取数据一些原理研究

    文章很多摘录了 http://blog.163.com/liaoxiangui@126/blog/static/7956964020131069843572/ 同时基于这篇文章的基础上,补充一些学习要 ...

随机推荐

  1. 北邮校赛 H. Black-white Tree (猜的)

    H. Black-white Tree 2017- BUPT Collegiate Programming Contest - sync 时间限制 1000 ms 内存限制 65536 KB 题目描述 ...

  2. sqlmap os shell解析

    0x00 Background 最近遇到测试环境,最后利用sqlmap的--os-shell参数取得shell.一直以来,对这个参数的工作原理不是十分的清晰.大致的思想应该是将脚本插入到数据库中,然后 ...

  3. ANY和SOME 运算符

    在SQL中ANY和SOME是同义词,所以下面介绍的时候只使用ANY,SOME的用法和功能和ANY一模一样.和IN运算符不同,ANY必须和其他的比较运算符共同使用,而且必须将比较运算符放在ANY 关键字 ...

  4. 输入输出格式之Python版

    # 有多组输入数据,但没有具体的告诉你有多少组,只是让你对应每组输入,应该怎样输出. while True: try: a, b = map(int, raw_input().strip().spli ...

  5. 树形dp(poj 1947 Rebuilding Roads )

    题意: 有n个点组成一棵树,问至少要删除多少条边才能获得一棵有p个结点的子树? 思路: 设dp[i][k]为以i为根,生成节点数为k的子树,所需剪掉的边数. dp[i][1] = total(i.so ...

  6. Rxjava与Retrofit的使用

    韩梦飞沙  韩亚飞  313134555@qq.com  yue31313  han_meng_fei_sha ---- -----

  7. POJ 1830 开关问题(Gauss 消元)

    开关问题 Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 7726   Accepted: 3032 Description ...

  8. 【混合背包】CDOJ1606 难喝的饮料

    #include<cstdio> #include<algorithm> using namespace std; int n,V,op[20010],c[20010],w[2 ...

  9. 【最大流Dinic模板】HDU1532&POJ1273-Drainage Ditches(16/3/6更正)

    #include<iostream> #include<cstdio> #include<cstdlib> #include<cstring> #inc ...

  10. 都9102年了,还不会Docker?10分钟带你从入门操作到实战上手

    Docker简述 Docker是一种OS虚拟化技术,是一个开源的应用容器引擎.它可以让开发者将应用打包到一个可移植的容器中,并且该容器可以运行在几乎所有linux系统中(Windows10目前也原生支 ...