关于vector push_back()与其他方式读取数据的效率对比(转)
引言:
在读取大量数据(数组)时,使用vector会尽量保证不会炸空间(MLE),但是相比于scanf的读取方式会慢上不少。但到底效率相差有多大,我们将通过对比测试得到结果。
测试数据:利用srand()函数生成1e7的随机数组(x[i] ∈ (0, 115000]),最终结果将是读取这1e7(一千万)的数组所消耗的时间。
测试环境:在Linux虚拟机下测试,利用编译命令:time ./t得到运行时间。
备注:在debug模式下运行,不开任何优化。
生成数据代码:
#include <bits/stdc++.h>
using namespace std; const int maxn = , lenth = ; int n, x, y; int main()
{
freopen("test.in", "w", stdout); cout << maxn << endl;
srand((unsigned int) time());
for(int i = ; i != maxn; ++i)
{
x = rand()%lenth+;
cout << x << endl;
} fclose(stdout);
return ;
}
对比读入:
1.正常使用push_back()读入
for(int i = ; i != n; ++i)
{
scanf("%d", &curr);
q1.push_back(curr);
}
2.每次空间不够时将vector数组增大空间
void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} for(int i = ; i != n; ++i)//main函数中
{
scanf("%d", &curr);
test_resize(curr);
}
3.scanf读入
for(int i = ; i != n; ++i)//main函数中
{
scanf("%d", &x[i]);
}
4.读入优化
int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
}
for(int i = ; i != n; ++i)
{
x[i] = read();
}
5.读入优化+resize(),再扔入vector数组
void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
} for(int i = ; i != n; ++i)
{
curr = read();
test_resize(curr);
}
测试结果:
1.push_back()读入
real 0m2.046s
user 0m1.620s
sys 0m0.428s
2.resize()后再读入
real 0m1.743s
user 0m1.636s
sys 0m0.104s
3.scanf读入
real 0m1.885s
user 0m1.776s
sys 0m0.108s
4.读入优化
real 0m0.996s
user 0m0.948s
sys 0m0.044s
5.读入优化+resize,再扔入vector数组
real 0m1.121s
user 0m1.036s
sys 0m0.084s
读入优化一骑绝尘,读入优化+resize位居第二,scanf和resize大致相当,push_back()最慢。
结论:
当数据范围很大的时候,建议使用vector的resize(lenth)+读入优化的方式进行读取,这样既最大限度降低了内存的浪费,又保证了不会在读入上花费太久。
完整测试程序:
#include <bits/stdc++.h>
using namespace std;
#define maxn 10000005 vector<int> q1, q2, q3;
int n, curr, num = -, size_1, size_2;
int x[maxn], input;
char a; void test_resize(int a)
{
if(num == size_2-)
{
q2.resize(size_2 += );
}
q2[++num] = a;
return ;
} int read()
{
input = ;
a = getchar();
while(a < '' || a > '')
a = getchar();
while(a >= '' && a <= '')
{
input = input*+a-'';
a = getchar();
}
return input;
} int main()
{
freopen("test.in", "r", stdin);
scanf("%d", &n);
for(int i = ; i != n; ++i)
{
//x[i] = read();
//curr = read();
//test_resize(curr);
//scanf("%d", &x[i]);
//scanf("%d", &curr);
//test_resize(curr);
//q3.push_back(curr);
}
return ;
}
转自:http://blog.csdn.net/kongse_qi/article/details/69526418
关于vector push_back()与其他方式读取数据的效率对比(转)的更多相关文章
- 关于vector push_back()与其他方式读取数据的效率对比
引言: 在读取大量数据(数组)时,使用vector会尽量保证不会炸空间(MLE),但是相比于scanf的读取方式会慢上不少.但到底效率相差有多大,我们将通过对比测试得到结果. 测试数据:利用srand ...
- EF 数据查询效率对比
优化的地方: 原地址:https://www.cnblogs.com/yaopengfei/p/9226328.html ①:如果仅是查询数据,并不对数据进行增.删.改操作,查询数据的时候可以取消状态 ...
- Tensorflow中使用tfrecord方式读取数据-深度学习-周振洋
本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释.并且本博客主要以图片数据为例进行介绍,如有错误,敬请斧正. 使用Tensorflow训练神经网络时,我们可以用 ...
- iNeuOS工业互联平台,增加OPC UA驱动,同步和订阅方式读取数据
目 录 1. 概述... 1 2. 平台演示... 2 3. OPC UA应用效果... 2 1. 概述 最近的项目,用户需要使用OPC UA读取数据,通 ...
- Java使用JDBC连接数据库逐条插入数据、批量插入数据、以及通过SQL语句批量导入数据的效率对比
测试用的示例java代码: package com.zifeiy.test.normal; import java.io.File; import java.io.FileOutputStream; ...
- 云端TensorFlow读取数据IO的高效方式
低效的IO方式 最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...
- [置顶]
云端TensorFlow读取数据IO的高效方式
低效的IO方式 最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行T ...
- SparkStreaming直连方式读取kafka数据,使用MySQL保存偏移量
SparkStreaming直连方式读取kafka数据,使用MySQL保存偏移量 1. ScalikeJDBC 2.配置文件 3.导入依赖的jar包 4.源码测试 通过MySQL保存kafka的偏移量 ...
- Oracle中读取数据一些原理研究
文章很多摘录了 http://blog.163.com/liaoxiangui@126/blog/static/7956964020131069843572/ 同时基于这篇文章的基础上,补充一些学习要 ...
随机推荐
- Codeforces Round #165 (Div. 1) Greenhouse Effect(DP)
Greenhouse Effect time limit per test 2 seconds memory limit per test 256 megabytes input standard i ...
- RabbitMQ (八) 队列的参数详解
代码中,我们通常这样声明一个队列: //声明队列 channel.QueueDeclare ( queue: QueueName, //队列名称 durable: false, //队列是否持久化.f ...
- 【带权并查集】【离散化】vijos P1112 小胖的奇偶
每个区间拆成r和l-1两个端点,若之内有偶数个1,则这两个端点对应的前缀的奇偶性必须相同,否则必须相反. 于是可以用带权并查集维护,每个结点储存其与其父节点的奇偶性是否相同,并且在路径压缩以及Unio ...
- Deep TEN: Texture Encoding Network
纹理特征,材料分类(Material Classification),在MINC-2500.Flickr Material Database.KTH-TIPS-2b.4D-Light-Field-Ma ...
- HDU 2389 Rain on your Parade(二分匹配,Hopcroft-Carp算法)
Rain on your Parade Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 655350/165535 K (Java/Ot ...
- .net 中两个日期算经过的月份数
DateTime startDate = DateTime.Parse("2014-11-1"); DateTime endDate = DateTime.Parse(" ...
- 怎么查看和修改 MySQL 的最大连接数
通常,mysql的最大连接数默认是100, 最大可以达到16384.1.查看最大连接数:show variables like '%max_connections%';2.修改最大连接数方法一:修改配 ...
- pca主成份分析方法
1.应用pca的前提 应用pca的前提是,连续信号具有相关性.相关性是什么,是冗余.就是要利用pca去除冗余. 2.pca的定义 pca是一种去除随机变量间相关性的线性变换.是一种常用的多元数据分析方 ...
- Android 卡顿优化 2 渲染优化
1.概述 2015年初google发布了Android性能优化典范,发了16个小视频供大家欣赏,当时我也将其下载,通过微信公众号给大家推送了百度云的下载地址(地址在文末,ps:欢迎大家订阅公众号),那 ...
- synchronized-异常
对于web应用程序,异常释放锁的情况,很可能对你的应用程序业务逻辑产生必要严重的错误,比如:执行某个队列任务,很多对象都会去等待第一个对象正常执行的结果返回再次去释放锁,那么其中摸个对象发生执行异常了 ...