freopen stdout 真的更快？

在一次数独作业中，我发现大部分同学提交的代码中都使用 freopen 来将 stdout 重新指向目标文件进行文件输出操作。我感到十分好奇，关于 freopen 我几乎从未用过，也很少在其它地方看到别人使用，也就是说至少我的认知里该函数不是个常用函数。再来点数据支持：

关于 fopen 在 Google 中的搜索结果有636万条

关于 freopen 在 Google 中的搜索结果有35.7万条，少了一个数量级！

所以我想同学们是不是从哪里道听途说了这种用法的好处，或者在某些环境下先入为主而习惯使用 freopen 。我尝试在班级群中发出疑问，果然两个原因都有：

助教 L 说：

我看部分同学的说法是：非常快

能够把文件输出的速度提升到极致

同学 H 说：

以前我记得做c++作业的时候，有这样的，然后我不懂怎么弄，大神就教我可以这样输出到文件，至于为什么。。。我去他宿舍问一下

同学 C 说：

。。。noip都用freopen

关于习惯问题，这里不做展开。只是简单提一下，freopen 重定向 stdout 会让一个普通程序的输出变得麻烦，比如同时读写若干个文件，同时要输出到 console 等。

关于性能问题，这个道听途说就十分不妥，都是做技术的，这样的小问题很容易动手验证，那我们就干一小票试试。

测试环境：Windows 10 / Visual Studio 2015

首先，来个函数，对一个连续写入操作计时：

clock_t do_write(FILE* fp, char* data, size_t len) {

    // The clock() function returns an approximation of processor time used by the program.

    // The  value  returned is the CPU time used so far as a clock_t;

    // to get the number of seconds used, divide by CLOCKS_PER_SEC.

    clock_t clock_begin, clock_end;

    clock_begin = clock();

    for (int i = 0; i < 1000; ++i) {

        auto n = fwrite(data, len, 1, fp);

        assert(n == 1);

    }

    fflush(fp);

    clock_end = clock();

    return clock_end - clock_begin;

}

关于 clock 计时请看以上代码注释

然后我们分别以 freopen, fopen 打开文件，并且写入 1000MB 看看并输出耗时：

int main() {

    auto data = new char[1048576]; // 1MB

    // initialize the buffer

    for (int i = 0; i < 1048576; ++i)

        data[i] = i;

    clock_t elapsed;

    auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);

    assert(fp_reopen != nullptr);

    elapsed = do_write(fp_reopen, data, 1048576);

    // redirect stdout to console

#ifdef _WIN32

    freopen("CONOUT$", "w", stdout);

#else

    freopen("/dev/tty", "w", stdout);

#endif

    printf("write with freopen clocks elapsed: %zu\n", elapsed);

    auto fp = fopen("data_fopen.bin", "wb");

    assert(fp != nullptr);

    elapsed = do_write(fp, data, 1048576);

    fclose(fp);

    printf("write with fopen clocks elapsed: %zu\n", elapsed);

    delete[] data;

}

测试输出：

write with freopen clocks elapsed: 1644

write with fopen clocks elapsed: 8855

好家伙，果然快很多！但是！为！什！么！？

难道是两种方式打开文件的缓存机制不同？

那行，让它们使用同样的缓存：

setvbuf 可以办到！如果不了解，请看这里：http://en.cppreference.com/w/c/io/setvbuf

auto cache = new char[512 * 1024];

auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);

assert(fp_reopen != nullptr);

setvbuf(fp_reopen, cache, _IOFBF, 512 * 1024);

...

auto fp = fopen("data_fopen.bin", "wb");

assert(fp != nullptr);

setvbuf(fp, cache, _IOFBF, 512 * 1024);

...

}

测试输出：

write with freopen clocks elapsed: 1761

write with fopen clocks elapsed: 9146

依！然！如！此！呆坐中。。。

连续写入大量数据
设置相同的缓存机制

还能有什么影响呢？

runtime library
操作系统
文件系统
磁盘硬件

想想我们拷贝大文件的现象，一般都是起步很快，然后会下降到一个较稳定的值上下徘徊，这个原因比较明显，系统及硬件都提供了一定的缓存。

刚开始缓存空闲，数据都飞快写入缓存
同时缓存也不停地在刷入磁盘
因为连续写入大量数据，磁盘本身很慢，缓存逐渐被填满，这时候写入缓存也需要等待（现象就是写入速度下降到刷磁盘的速度）

那行了，我们测试是写2个文件，一个先一个后，并且是连续操作，也就是说先写的文件优先享受了缓存带来的好处，后写的文件没有了这个优势。思考完，做个验证：

// 先测 fopen

auto fp = fopen("data_fopen.bin", "wb");

assert(fp != nullptr);

setvbuf(fp, cache, _IOFBF, 512 * 1024);

elapsed = do_write(fp, data, 1048576);

fclose(fp);

printf("write with fopen clocks elapsed: %zu\n", elapsed);

// 再测 freopen

auto fp_reopen = freopen("data_freopen.bin", "wb", stdout);

assert(fp_reopen != nullptr);

setvbuf(fp_reopen, cache, _IOFBF, 512 * 1024);

elapsed = do_write(fp_reopen, data, 1048576);

// redirect stdout to console

#ifdef _WIN32

freopen("CONOUT$", "w", stdout);

#else

freopen("/dev/tty", "w", stdout);

#endif

printf("write with freopen clocks elapsed: %zu\n", elapsed);

测试输出：

write with fopen clocks elapsed: 1561

write with freopen clocks elapsed: 9267

哈哈！答案揭晓！ freopen stdout 并没有性能上的优势！

进一步做验证，我们依然按照 freopen, fopen 的顺序来测试，但是在两次测试中间加上 sleep 让缓存能空闲出来。这里就不贴代码了，直接上结果:

write with freopen clocks elapsed: 2326

write with fopen clocks elapsed: 2519

结论

要动手验证！验证！验证！而不是道听途说！

Linux也做过测试，结论也一样！

参考

刘未鹏 - 遇到问题为什么应该自己动手

freopen stdout 真的更快？的更多相关文章

精通Web Analytics 2.0 （9）第七章：失败更快：爆发测试与实验的能量
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术第七章:失败更快:爆发测试与实验的能量欢迎来到实验和测试这个棒极了的世界! 如果Web拥有一个超越所有其他渠道的巨大优势,它就 ...
mysql DB server端，如何让读写更快
其实,我不是专业的DB管理同学,甚至算不上会了解.只是在最近的工作中,遇到了DB server端优化的契机,所以把这些手段记录下来: 通过调整这个参数的值,可以让DB更给力: 这两个参数的含义: 1. ...
利用1.1.1.1进行DNS网络加速,仅需2分钟让网络更快
NEWS 近日,Cloudflare 和 APNIC联合推出了1.1.1.1DNS网络加速. Cloudflare 运行全球规模最大.速度最快的网络之一.APNIC 是一个非营利组织,管理着亚太和大洋 ...
让Python代码更快运行的 5 种方法
不论什么语言,我们都需要注意性能优化问题,提高执行效率.选择了脚本语言就要忍受其速度,这句话在某种程度上说明了Python作为脚本语言的不足之处,那就是执行效率和性能不够亮.尽管Python从未如C和 ...
比Python、Java更快的 Go 语言，能否称霸江湖？
关注之后加星标,江湖要事早知道文章来源:jb51.net 有一种语言堪称比语言排行榜前五热门选手的Python.Java更快,它就是GO语言. Go于2009年11月正式宣布推出,成为开放源代码 ...
linux 下程序员专用搜索源码用来替代grep的软件ack(后来发现一个更快的: ag)，且有vim插件的
发现一个比ack更快更好用的: https://github.com/ggreer/the_silver_searcher , 使用时命令为ag,它是基于ack的代码二次开发的,所有使用方法基本 ...
11个点让你的Spring Boot启动更快
前言使用的是 OpenJDK 11. java --version openjdk 11.0.1 2018-10-16 OpenJDK Runtime Environment 18.9 (build ...
假如 UNION ALL 里面的子句有 JOIN ，那个执行更快呢
比如: select id, name from table1 where name = 'x' union all select id, name from table2 where name = ...
【译】更快的方式实现PHP数组去重
原文:Faster Alternative to PHP’s Array Unique Function 概述使用PHP的array_unique()函数允许你传递一个数组,然后移除重复的值,返回一 ...

随机推荐

python openpyxl.md
Openpyxl 创建一个工作簿下面是创建一个工作簿.而每个工作簿至少一个工作表我们可以通过active获取正在运行的工作表. In [1]: from openpyxl import Workbo ...
Nowcoder 提高组练习赛-R2
https://www.nowcoder.com/acm/contest/173#question T1:https://www.nowcoder.com/acm/contest/173/A 题意概述 ...
MyBatis之Collection
Collection翻译过来,意为"集合"的意思,既然是集合,肯定是代表多个. MyBatis以其自身,小巧易懂,闻名于JavaEE. 传统的JDBC就不说了,Hibernate记 ...
CAN-bus接口控制实验
CAN-bus接口控制实验 2016-04-12 20:38:41来源: eefocus 关键字:CAN bus 接口控制收藏评论(0) 分享到微博 QQ 微信 LinkedIn 一．实 ...
ubuntu14.04上设置默认python命令是执行python3而不是Python2
update-alternatives --install /usr/bin/python python /usr/bin/python2 100 update-alternatives --inst ...
大数据入门第十六天——流式计算之storm详解（二）常用命令与wc实例
一.常用命令 1.提交命令提交任务命令格式:storm jar [jar路径] [拓扑包名.拓扑类名] [拓扑名称] torm jar examples/storm-starter/storm-st ...
Tomcat 动态数据库连接池
package com.boguan.bte.util; import java.sql.Connection;import java.sql.SQLException;import java.uti ...
20155330 《网络攻防》 Exp3 免杀原理与实践
20155330 <网络攻防> Exp3 免杀原理与实践基础问题回答杀软是如何检测出恶意代码的? 基于特征码.先对流行代码特征的提取,然后进行程序的比对,如果也检测到相应的特征码的程序 ...
Hadoop日记Day7---HDFS的WED端口
HDFS 对外提供了可供访问的http server,开放了很多端口,下面介绍常用的几个端口(http://hadoop:……). 一.50070 端口,查看NameNode 状态,如图1.1所示. ...
asp.net mvc2+nhibernate实体类映射问题之“尝试创建Controller类型的控制器时出错请确保控制器具有无参数公共构造函数”
程序出了问题,解决后发现如此简单,犯的错误是如此的低级啊,特此记录! 运行程序总是在浏览器中看到一片空白,什么也没有,用application_error跟踪发现抓出一个这样的异常然后浏览器中就是这 ...

freopen stdout 真的更快？

freopen stdout 真的更快？

结论

参考

freopen stdout 真的更快？的更多相关文章

随机推荐

热门专题