freopen stdout 真的更快?
freopen stdout 真的更快?
在一次数独作业中,我发现大部分同学提交的代码中都使用 freopen 来将 stdout 重新指向目标文件进行文件输出操作。我感到十分好奇,关于 freopen 我几乎从未用过,也很少在其它地方看到别人使用,也就是说至少我的认知里该函数不是个常用函数。再来点数据支持:
- 关于
fopen在 Google 中的搜索结果有636万条

- 关于
freopen在 Google 中的搜索结果有35.7万条,少了一个数量级!

所以我想同学们是不是从哪里道听途说了这种用法的好处,或者在某些环境下先入为主而习惯使用 freopen 。我尝试在班级群中发出疑问,果然两个原因都有:
助教 L 说:
我看部分同学的说法是:非常快
能够把文件输出的速度提升到极致
同学 H 说:
以前我记得做c++作业的时候,有这样的,然后我不懂怎么弄,大神就教我可以这样输出到文件,至于为什么。。。我去他宿舍问一下
同学 C 说:
。。。noip都用freopen
关于习惯问题,这里不做展开。只是简单提一下,freopen 重定向 stdout 会让一个普通程序的输出变得麻烦,比如同时读写若干个文件,同时要输出到 console 等。
关于性能问题,这个道听途说就十分不妥,都是做技术的,这样的小问题很容易动手验证,那我们就干一小票试试。
测试环境:Windows 10 / Visual Studio 2015
- 首先,来个函数,对一个连续写入操作计时:
clock_t do_write(FILE* fp, char* data, size_t len) {
// The clock() function returns an approximation of processor time used by the program.
// The value returned is the CPU time used so far as a clock_t;
// to get the number of seconds used, divide by CLOCKS_PER_SEC.
clock_t clock_begin, clock_end;
clock_begin = clock();
for (int i = 0; i < 1000; ++i) {
auto n = fwrite(data, len, 1, fp);
assert(n == 1);
}
fflush(fp);
clock_end = clock();
return clock_end - clock_begin;
}
关于 clock 计时请看以上代码注释
- 然后我们分别以
freopen,fopen打开文件,并且写入 1000MB 看看并输出耗时:
int main() {
auto data = new char[1048576]; // 1MB
// initialize the buffer
for (int i = 0; i < 1048576; ++i)
data[i] = i;
clock_t elapsed;
auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);
assert(fp_reopen != nullptr);
elapsed = do_write(fp_reopen, data, 1048576);
// redirect stdout to console
#ifdef _WIN32
freopen("CONOUT$", "w", stdout);
#else
freopen("/dev/tty", "w", stdout);
#endif
printf("write with freopen clocks elapsed: %zu\n", elapsed);
auto fp = fopen("data_fopen.bin", "wb");
assert(fp != nullptr);
elapsed = do_write(fp, data, 1048576);
fclose(fp);
printf("write with fopen clocks elapsed: %zu\n", elapsed);
delete[] data;
}
测试输出:
write with freopen clocks elapsed: 1644
write with fopen clocks elapsed: 8855
好家伙,果然快很多!但是!为!什!么!?
难道是两种方式打开文件的缓存机制不同?
- 那行,让它们使用同样的缓存:
setvbuf 可以办到!如果不了解,请看这里:http://en.cppreference.com/w/c/io/setvbuf
auto cache = new char[512 * 1024];
auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);
assert(fp_reopen != nullptr);
setvbuf(fp_reopen, cache, _IOFBF, 512 * 1024);
...
auto fp = fopen("data_fopen.bin", "wb");
assert(fp != nullptr);
setvbuf(fp, cache, _IOFBF, 512 * 1024);
...
}
测试输出:
write with freopen clocks elapsed: 1761
write with fopen clocks elapsed: 9146
依!然!如!此!呆坐中。。。
- 连续写入大量数据
- 设置相同的缓存机制
还能有什么影响呢?
- runtime library
- 操作系统
- 文件系统
- 磁盘硬件
想想我们拷贝大文件的现象,一般都是起步很快,然后会下降到一个较稳定的值上下徘徊,这个原因比较明显,系统及硬件都提供了一定的缓存。
- 刚开始缓存空闲,数据都飞快写入缓存
- 同时缓存也不停地在刷入磁盘
- 因为连续写入大量数据,磁盘本身很慢,缓存逐渐被填满,这时候写入缓存也需要等待(现象就是写入速度下降到刷磁盘的速度)
那行了,我们测试是写2个文件,一个先一个后,并且是连续操作,也就是说先写的文件优先享受了缓存带来的好处,后写的文件没有了这个优势。思考完,做个验证:
// 先测 fopen
auto fp = fopen("data_fopen.bin", "wb");
assert(fp != nullptr);
setvbuf(fp, cache, _IOFBF, 512 * 1024);
elapsed = do_write(fp, data, 1048576);
fclose(fp);
printf("write with fopen clocks elapsed: %zu\n", elapsed);
// 再测 freopen
auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);
assert(fp_reopen != nullptr);
setvbuf(fp_reopen, cache, _IOFBF, 512 * 1024);
elapsed = do_write(fp_reopen, data, 1048576);
// redirect stdout to console
#ifdef _WIN32
freopen("CONOUT$", "w", stdout);
#else
freopen("/dev/tty", "w", stdout);
#endif
printf("write with freopen clocks elapsed: %zu\n", elapsed);
测试输出:
write with fopen clocks elapsed: 1561
write with freopen clocks elapsed: 9267
哈哈!答案揭晓! freopen stdout 并没有性能上的优势!
- 进一步做验证,我们依然按照
freopen,fopen的顺序来测试,但是在两次测试中间加上sleep让缓存能空闲出来。这里就不贴代码了,直接上结果:
write with freopen clocks elapsed: 2326
write with fopen clocks elapsed: 2519
结论
要动手验证!验证!验证!而不是道听途说!
Linux也做过测试,结论也一样!
参考
刘未鹏 - 遇到问题为什么应该自己动手
freopen stdout 真的更快?的更多相关文章
- 精通Web Analytics 2.0 (9) 第七章:失败更快:爆发测试与实验的能量
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术 第七章:失败更快:爆发测试与实验的能量 欢迎来到实验和测试这个棒极了的世界! 如果Web拥有一个超越所有其他渠道的巨大优势,它就 ...
- mysql DB server端,如何让读写更快
其实,我不是专业的DB管理同学,甚至算不上会了解.只是在最近的工作中,遇到了DB server端优化的契机,所以把这些手段记录下来: 通过调整这个参数的值,可以让DB更给力: 这两个参数的含义: 1. ...
- 利用1.1.1.1进行DNS网络加速,仅需2分钟让网络更快
NEWS 近日,Cloudflare 和 APNIC联合推出了1.1.1.1DNS网络加速. Cloudflare 运行全球规模最大.速度最快的网络之一.APNIC 是一个非营利组织,管理着亚太和大洋 ...
- 让Python代码更快运行的 5 种方法
不论什么语言,我们都需要注意性能优化问题,提高执行效率.选择了脚本语言就要忍受其速度,这句话在某种程度上说明了Python作为脚本语言的不足之处,那就是执行效率和性能不够亮.尽管Python从未如C和 ...
- 比Python、Java更快的 Go 语言,能否称霸江湖?
关注之后加星标,江湖要事早知道 文章来源:jb51.net 有一种语言堪称比语言排行榜前五热门选手的Python.Java更快,它就是GO语言. Go于2009年11月正式宣布推出,成为开放源代码 ...
- linux 下程序员专用搜索源码用来替代grep的软件ack(后来发现一个更快的: ag), 且有vim插件的
发现一个比ack更快更好用的: https://github.com/ggreer/the_silver_searcher , 使用时命令为ag,它是基于ack的代码二次开发的,所有使用方法基本 ...
- 11个点让你的Spring Boot启动更快
前言 使用的是 OpenJDK 11. java --version openjdk 11.0.1 2018-10-16 OpenJDK Runtime Environment 18.9 (build ...
- 假如 UNION ALL 里面的子句 有 JOIN ,那个执行更快呢
比如: select id, name from table1 where name = 'x' union all select id, name from table2 where name = ...
- 【译】更快的方式实现PHP数组去重
原文:Faster Alternative to PHP’s Array Unique Function 概述 使用PHP的array_unique()函数允许你传递一个数组,然后移除重复的值,返回一 ...
随机推荐
- 设计模式_享元设计模式(flyweight)
享元模式以共享的方式高效地支持大量的细粒度对象.很多很小的对象,这些对象有很多共同的东西,那就变成一个对象,还有些不同的东西,作为外部的属性,用方法的参数传入 public class Flyweig ...
- div宽度随屏幕大小变化
题目: 一个页面上两个div左右铺满整个浏览器, 要保证左边的div一直为100px,右边的div跟随浏览器大小变化, 比如浏览器为500,右边div为400,浏览器为900,右边div为800. 方 ...
- lua-resty-gearman模块
粘贴一段百度对gearman的解释: Gearman是一个用来把工作委派给其他机器.分布式的调用更适合做某项工作的机器.并发的做某项工作在多个调用间做负载均衡.或用来在调用其它语言的函数的系统. lu ...
- Python2.7-re模块
re模块 1.正则表达式的语法 '.' 匹配任意字符,若指定了re.S,则可以匹配换行符'^' 匹配行首,即字符串的开头,若指定了re.M,会自动匹配每行开头'$' 匹配行尾,同上'*' 匹配大于等于 ...
- (转)win7批量创建用户
@echo off::zhangsan 改为你需要建立的用户名,123456改为你的密码,后面的两个参数的意思是“用户::不可以更改密码”和“密码永不过期”net user xiaowei 12345 ...
- jqgrid 选中行触发编辑,切换下一行时验证和异步保存上一行数据
有时,我们需要批量修改或填写一些相似的数据.可以以jqgrid表来显示,可能的效果如下: 选中触发行编辑参考:jqgrid 单击行启用行编辑,切换行保存原编辑行 本文主要说说验证和异步保存上一条数据的 ...
- 通过HttpWebRequest调用webService
调用远端接口,向远端接口写入一个xml文件(loginLog为xml的字符串).关键方法如下: public object InsertAuditLog(string loginLog) { //Ws ...
- less初识
一种 动态 样式 语言. LESS 将 CSS 赋予了动态语言的特性,如 变量, 继承,运算, 函数. LESS 既可以在 客户端 上运行 (支持IE 6+, Webkit, Firefox),也可以 ...
- 【转】CentOS 5 上安装git
转自 http://www.cnblogs.com/Neddy/archive/2011/02/28/1967548.html 注意安装的时候 都要以root身份 //先安装git依赖的包 yum i ...
- Linux 设置core dump
Linux 设置core dump