1 二进制IO(Binary IO)

在前一篇我们了解了逐字符读写和逐行读写函数。

如果我们在读写二进制文件,希望以此读写整个文件内容,这两个函数虽然可以实现,但是明显会很麻烦且多次循环明显效率很低。

为了应对这种场景,标准IO库提供了fread和fwrite函数。

函数声明:

#include <stdio.h>

size_t fread(void *restrict ptr, size_t size, size_t nobj, FILE *restrict fp);

size_t fwrite(const void *restrict ptr, size_t size size_t nobj, FILE *restrict fp);

函数用法;

a) 读写一个数组。

float data[10];

if (write(&data[2], sizeof(float), 4, fp) != 4)

    err_sys(“fwrite error");

本例中,从流fp中读取4个float型数据填入到数组下表从2到5得位置中。

b) 读写一个结构体

struct {

    short  count;

    long   total;

    char   name[NAMESIZE];

} item;

if (fwrite(&item, sizeof(item), 1, fp) != 1)

    err_sys(“fwrite error");

本例中,从fp读取数据填入到一个结构体中。

 

上面两例都可以认为是读写一个结构体的数组,参数size是结构体的长度,参数nobj是数组中要读写的元素的个数。

 

函数返回值:

两个函数的返回值都是读写的元素个数。

对于读函数,返回值可能会比nobj小,如果有异常抛出或者读到了文件结尾。这时需要调用函数ferror或feof来判断。

对于写函数,返回值比nobj小,则一定是有异常抛出。

 

函数细节:

在上面的例子中,我们通过fwrite函数填充了一个结构体,那么如果读写不在一个系统中,那么结构体的内存布局可能并不相同,这对于现在的多系统互联工作的场景下很常见。我们会在讨论socket时回来继续看这个问题,实际的解决方案就是在不同系统间读写二进制数据时使用相同的协议。

 

2 定位流(Positioning a Stream)

我们有三种方法对流进行定位:

  • 函数ftell和fseek。将文件的当前偏移位置存储在long integer型变量中;
  • 函数ftello和fseeko。将文件的当前偏移量存储在off_t型变量中;
  • 函数fgetpos和fsetpos。使用数据类型fpos_t记录文件的当前偏移量。

 

ftell和fseek函数声明:

#include <stdio.h>

long ftell(FILE* fp);    // Returns:current file position indicator if OK, -1L on error

int fseek(FILE* fp, long offset, int whence);       // Returns:0 if OK , -1 on error

void rewind(FILE* fp);

函数细节:

  • 二进制文件的偏移量是从文件开始到当前位置的字节数;
  • ftell函数返回当前文件的偏移位置;
  • fseek函数用来定位文件到指定偏移位置;
  • fseek函数的参数whence,用来设置计算偏移量的方法:SEEK_SET表示从文件开头开始计算,SEEK_CUR表示从文件当前偏移位置开始计算,SEEK_END表示从文件结尾开始计算。
  • 对于一些非Unix操作系统,存储文本文件的存储格式会有所不同,当前文件偏移量无法通过字节数来表示,这种情况下,参数whence需要设置为SEEK_SET,并且offset只有两个值可以使用:0,表示倒回文本开头;另一个可用值为函数ftell的返回值。

 

ftello和fseeko函数声明:

#include <stdio.h>

off_t ftello(FILE* fp);     // Returns: current file position indicator if OK, (off_t) -1 on error

int fseeko(FILE* fp, off_t offset, int whence);     /// Returns: 0 if OK, -1 on error

函数细节:

  • 这两个函数和上面的ftell和fseek功能相同,只是返回值类型不是long,而改成了off_t,实现上可以让off_t的表示范围更大。

 

fgetpos和fsetpos函数声明:

#include <stdio.h>

int fgetpos(FILE* restrict fp, fpos_t *restrict pos);

int fsetpos(FILE* fp, const fpos_t pos);

函数细节:

  • fgetpos函数保存当前文件偏移量到参数pos中
  • fgetpos得到的pos可以用来使用fsetpos设置当前文件偏移量到之前的位置。

 

3 格式化输入输出

格式化输出函数

有五个printf函数负责格式化输出。

函数声明:

#include <stdio.h>

int printf(const char *restrict format, ...);

int fprintf(FILE *restrict fp, const char *restrict format, ...);

int dprintf(int fd, const char *restrict format, ..);

      // All three return : number of characters output if OK , negative value if output error

int sprintf(char *resrict buf, const char *restrict format, ...);

      // Returns: number of characters stored in array if OK, negative value if encoding error

int snprintf(char *restrict buf, size_t n, const char *restrict format, ...);

      // Returns: number of characters,that would have been stored in array if buffer was large enough, negative value if encoding error

函数细节:

  • printf输出到标准输出;
  • fprintf输出到指定的流中;
  • dprintf输出到指定的文件描述符中;
  • sprintf将格式化字符串写入到指定的buffer数组中,自动在结尾处加上一个null结尾符,但是不计入返回值中,并且,sprintf在buffer不够大时可能发生越界,因此需要使用者保证buffer足够大;
  • snprintf防止越界,在springf的参数中增加了buffer的大小参数,所有越界写入的字符都被忽略,如果返回值比buffer得长度要小,则说明输出没有被截断。

 

格式化输入函数

函数声明:

#include <stdio.h>

int scanf(const char *restrict format, ...);

int fscanf(FILE *restrict fp, const char *restrict format, ...);

int sscanf(const char *restrict buf, const char *restrict format, ...);

函数细节:

  • format参数后面接得参数,包含存放读入字符串的变量地址。

更多关于格式化输入输出的细节可以自己查询Unix操作系统手册。

 

4 从流中获取文件描述符

函数声明:

#include <stdio.h>

int fileno(FILE* fp);       // Returns: the file descriptor associated with the stream

如果我们需要调用dup和fcntl,则需要调用该函数。

 

5 临时文件(Temporary Files)

标准IO库提供了两个函数用于创建临时文件。

函数声明:

#include <stdio.h>

char* tempnam(char *ptr);

FILE* tmpfile(void);

函数细节:

  • 函数tmpnam生成一个字符串,该字符串为一个合法的路径名,并且不和任何已存在的文件重复。
  • 函数tmpnam每次调用都生成不同的字符串,知道TMP_MAX次数。
  • 如果函数tempnam的参数ptr为NULL,则生成的路径字符串存在内存静态区,函数返回值为指向该路径字符串的指针。如果随后再次使用null参数调用tempnam,会覆盖之前生成的字符串。
  • 如果函数tempnam的参数ptr不是NULL,那么生成的路径字符串存在ptr指向的数组内,所以需要保证ptr指向的数组的长度至少为L_tmpnam。
  • 函数tmpfile函数创建一个临时二进制文件(type wb+),程序终止或者该文件被关闭,则该文件自动被删除。对于UNIX操作系统而言,生成一个二进制文件并没有什么影响,因为内核并不区分文本文件还是二进制文件。

Example:

Code:

#include "apue.h"

 

int

main(void)

{

    char    name[L_tmpnam], line[MAXLINE];

    FILE    *fp;

 

    printf("%s\n", tmpnam(NULL));       /* first temp name */

 

    tmpnam(name);                       /* second temp name */

    printf("%s\n", name);

 

    if ((fp = tmpfile()) == NULL)       /* create temp file */

        err_sys("tmpfile error");

    fputs("one line of output\n", fp);  /* write to temp file */

    rewind(fp);                         /* then read it back */

    if (fgets(line, sizeof(line), fp) == NULL)

        err_sys("fgets error");

    fputs(line, stdout);                /* print the line we wrote */

 

    exit();

}

 

在系统The Single UNIX Specification定义了另外两个函数处理临时文件:

函数声明:

char* mkdtemp(char* template);    // Returns: pointer to directory name if OK, NULL on error

int mkstemp(char* template);    // Returns: file descriptor if OK, -1 on error

函数细节:

  • mkdtemp函数创建一个名字唯一的文件夹
  • mkstemp函数创建一个名字唯一的常规文件(regular file)
  • 命名规则为 template + 六位随机字符

 

6 内存流(Memory Streams)

有的标准输入输出流并没有对应打开的硬盘文件,所有操作都是与内存中buffer进行数据交换,这些流被叫做内存流(memory streams)。

函数声明:

#include <stdio.h>

FILE* fmemopen(void *restrict buf, size_t size, const char *restrict type);

// Returns: stream pointer if OK, NULL on error

函数细节:

  • 参数buf指定使用的buffer,size为该buffer的大小,如果只指定size,而buf为null,那么fmemopen根据size的大小分配内存,由fmemopen分配的内存在流关闭时自动被释放;
  • 参数type控制该流的功能.

 

7 总结

标准IO函数库被大多数UNIX应用使用。

在使用的时候,注意哪里使用了buffer来处理,因为这是容易引起迷惑的地方。

 

 

参考资料:

《Advanced Programming in the UNIX Envinronment 3rd》

 

UNIX高级环境编程(7)标准IO函数库 - 二进制文件IO,流定位,创建临时文件和内存流的更多相关文章

  1. UNIX高级环境编程1

    UNIX高级环境编程1 故宫角楼是很多摄影爱好者常去的地方,夕阳余辉下的故宫角楼平静而安详. 首先,了解一下进程的基本概念,进程在内存中布局和内容. 此外,还需要知道运行时是如何为动态数据结构(如链表 ...

  2. UNIX高级环境编程(6)标准IO函数库 - 流的概念和操作

    标准IO函数库隐藏了buffer大小和分配的细节,使得我们可以不用关心预分配的内存大小是否正确的问题. 虽然这使得这个函数库很容易用,但是如果我们对函数的原理不熟悉的话,也容易遇到很多问题.   1 ...

  3. UNIX高级环境编程(14)文件IO - O_DIRECT和O_SYNC详解 < 海棠花溪 >

    春天来了,除了工作学习,大家也要注意锻炼身体,多出去运动运动.  上周末在元大都遗址公园海棠花溪拍的海棠花.   进入正题. O_DIRECT和O_SYNC是系统调用open的flag参数.通过指定o ...

  4. UNIX高级环境编程(13)信号 - 概念、signal函数、可重入函数

    信号就是软中断. 信号提供了异步处理事件的一种方式.例如,用户在终端按下结束进程键,使一个进程提前终止.   1 信号的概念 每一个信号都有一个名字,它们的名字都以SIG打头.例如,每当进程调用了ab ...

  5. UNIX高级环境编程(10)进程控制(Process Control)- 竞态条件,exec函数,解释器文件和system函数

    本篇主要介绍一下几个内容: 竞态条件(race condition) exec系函数 解释器文件    1 竞态条件(Race Condition) 竞态条件:当多个进程共同操作一个数据,并且结果依赖 ...

  6. Unix高级环境编程

    [07] Unix进程环境==================================1. 进程终止    atexit()函数注册终止处理程序.    exit()或return语句:    ...

  7. UNIX高级环境编程(9)进程控制(Process Control)- fork,vfork,僵尸进程,wait和waitpid

    本章包含内容有: 创建新进程 程序执行(program execution) 进程终止(process termination) 进程的各种ID   1 进程标识符(Process Identifie ...

  8. UNIX高级环境编程(15)进程和内存分配 < 故宫角楼 >

    故宫角楼是很多摄影爱好者常去的地方,夕阳余辉下的故宫角楼平静而安详.   首先,了解一下进程的基本概念,进程在内存中布局和内容. 此外,还需要知道运行时是如何为动态数据结构(如链表和二叉树)分配额外内 ...

  9. UNIX高级环境编程(8)进程环境(Process Environment)- 进程的启动和退出、内存布局、环境变量列表

    在学习进程控制相关知识之前,我们需要了解一个单进程的运行环境. 本章我们将了解一下的内容: 程序运行时,main函数是如何被调用的: 命令行参数是如何被传入到程序中的: 一个典型的内存布局是怎样的: ...

随机推荐

  1. rails跳过回调的方法

    rails中的回调可跳过,使用下列方法即可: decrement decrement_counter delete delete_all increment increment_counter tog ...

  2. XRP节点部署

    目录 XRP节点部署 准备 硬软件配置(建议) 安装Rippled服务 一. 以Stock Server模型运行 在何种情况下运行此模式 二 .以 Validator模式运行 在何种情况下运行此模式 ...

  3. C# 获取config文件 实体转换

    随着项目的扩展,单独的key,value配置文件已经不能满足需求了 这里需要自定义配置节点,例如 <!--自定义 具体实体类配置问节点信息--> <School Name=" ...

  4. JBoss 实战(1)

    转自:https://www.cnblogs.com/aiwz/p/6154594.html JBOSS的诞生 1998年,在硅谷SUN公司的SAP实验室,一个年轻人正坐在电脑前面思考,然后写着什么东 ...

  5. WIN 10 初体验:期待越多失望越大

    我大多数时候使用 MacBook,不过 WIN 10(预览版)的推送还是让我忍不住升级玩玩——它是微软史上首款真正意义上的免费操作系统,正式版将与中国诸多互联网巨头联合提供升级工具分发这一体现了微软迎 ...

  6. (一)面向对象的javascript

    javascript是一门典型的动态类语言 一:鸭式辨型(指导我们关注对象的行为,而不关注对象本身). var duck = { duckString: function(){ console.log ...

  7. [转]Log4Net日志插件配置详解

    log4net是一款优秀的第三方日志框架,可以很容易的加载到开发项目中(引用log4net的dll,再配置些基本参数即可),帮助程序员把日志信息输出到各种不同的目标,常见的有文本.数据库.window ...

  8. [javaSE] 集合框架(ArrayList,LinkedList,Vector)

    ArrayList特点:底层使用数组数据结构,查询速度快(使用脚标查),插入删除慢(索引要改变) LinkedList特点:底层使用链表数据结构,查询慢(需要一个一个去问),插入删除快 Vector特 ...

  9. UNIX高手应该保持的习惯

    UNIX 高手的 10 个习惯 克服不良的 UNIX 使用模式 采用 10 个能够提高您的 UNIX® 命令行效率的好习惯——并在此过程中摆脱不良的使用模式.本文循序渐进地指导您学习几项用于命令行操作 ...

  10. Eclipse发布的Dynamical web项目在Tomacat文件夹下显示

    Eclipse设置了Tomacat后,项目信息会在你的workspace上,在Tomacat文件夹上是没有的.但是通过设置是可以在Tomacat文件夹上存在的. 配置好服务器后,先关闭服务器,然后在E ...