1 二进制IO(Binary IO)

在前一篇我们了解了逐字符读写和逐行读写函数。

如果我们在读写二进制文件,希望以此读写整个文件内容,这两个函数虽然可以实现,但是明显会很麻烦且多次循环明显效率很低。

为了应对这种场景,标准IO库提供了fread和fwrite函数。

函数声明:

#include <stdio.h>

size_t fread(void *restrict ptr, size_t size, size_t nobj, FILE *restrict fp);

size_t fwrite(const void *restrict ptr, size_t size size_t nobj, FILE *restrict fp);

函数用法;

a) 读写一个数组。

float data[10];

if (write(&data[2], sizeof(float), 4, fp) != 4)

    err_sys(“fwrite error");

本例中,从流fp中读取4个float型数据填入到数组下表从2到5得位置中。

b) 读写一个结构体

struct {

    short  count;

    long   total;

    char   name[NAMESIZE];

} item;

if (fwrite(&item, sizeof(item), 1, fp) != 1)

    err_sys(“fwrite error");

本例中,从fp读取数据填入到一个结构体中。

 

上面两例都可以认为是读写一个结构体的数组,参数size是结构体的长度,参数nobj是数组中要读写的元素的个数。

 

函数返回值:

两个函数的返回值都是读写的元素个数。

对于读函数,返回值可能会比nobj小,如果有异常抛出或者读到了文件结尾。这时需要调用函数ferror或feof来判断。

对于写函数,返回值比nobj小,则一定是有异常抛出。

 

函数细节:

在上面的例子中,我们通过fwrite函数填充了一个结构体,那么如果读写不在一个系统中,那么结构体的内存布局可能并不相同,这对于现在的多系统互联工作的场景下很常见。我们会在讨论socket时回来继续看这个问题,实际的解决方案就是在不同系统间读写二进制数据时使用相同的协议。

 

2 定位流(Positioning a Stream)

我们有三种方法对流进行定位:

  • 函数ftell和fseek。将文件的当前偏移位置存储在long integer型变量中;
  • 函数ftello和fseeko。将文件的当前偏移量存储在off_t型变量中;
  • 函数fgetpos和fsetpos。使用数据类型fpos_t记录文件的当前偏移量。

 

ftell和fseek函数声明:

#include <stdio.h>

long ftell(FILE* fp);    // Returns:current file position indicator if OK, -1L on error

int fseek(FILE* fp, long offset, int whence);       // Returns:0 if OK , -1 on error

void rewind(FILE* fp);

函数细节:

  • 二进制文件的偏移量是从文件开始到当前位置的字节数;
  • ftell函数返回当前文件的偏移位置;
  • fseek函数用来定位文件到指定偏移位置;
  • fseek函数的参数whence,用来设置计算偏移量的方法:SEEK_SET表示从文件开头开始计算,SEEK_CUR表示从文件当前偏移位置开始计算,SEEK_END表示从文件结尾开始计算。
  • 对于一些非Unix操作系统,存储文本文件的存储格式会有所不同,当前文件偏移量无法通过字节数来表示,这种情况下,参数whence需要设置为SEEK_SET,并且offset只有两个值可以使用:0,表示倒回文本开头;另一个可用值为函数ftell的返回值。

 

ftello和fseeko函数声明:

#include <stdio.h>

off_t ftello(FILE* fp);     // Returns: current file position indicator if OK, (off_t) -1 on error

int fseeko(FILE* fp, off_t offset, int whence);     /// Returns: 0 if OK, -1 on error

函数细节:

  • 这两个函数和上面的ftell和fseek功能相同,只是返回值类型不是long,而改成了off_t,实现上可以让off_t的表示范围更大。

 

fgetpos和fsetpos函数声明:

#include <stdio.h>

int fgetpos(FILE* restrict fp, fpos_t *restrict pos);

int fsetpos(FILE* fp, const fpos_t pos);

函数细节:

  • fgetpos函数保存当前文件偏移量到参数pos中
  • fgetpos得到的pos可以用来使用fsetpos设置当前文件偏移量到之前的位置。

 

3 格式化输入输出

格式化输出函数

有五个printf函数负责格式化输出。

函数声明:

#include <stdio.h>

int printf(const char *restrict format, ...);

int fprintf(FILE *restrict fp, const char *restrict format, ...);

int dprintf(int fd, const char *restrict format, ..);

      // All three return : number of characters output if OK , negative value if output error

int sprintf(char *resrict buf, const char *restrict format, ...);

      // Returns: number of characters stored in array if OK, negative value if encoding error

int snprintf(char *restrict buf, size_t n, const char *restrict format, ...);

      // Returns: number of characters,that would have been stored in array if buffer was large enough, negative value if encoding error

函数细节:

  • printf输出到标准输出;
  • fprintf输出到指定的流中;
  • dprintf输出到指定的文件描述符中;
  • sprintf将格式化字符串写入到指定的buffer数组中,自动在结尾处加上一个null结尾符,但是不计入返回值中,并且,sprintf在buffer不够大时可能发生越界,因此需要使用者保证buffer足够大;
  • snprintf防止越界,在springf的参数中增加了buffer的大小参数,所有越界写入的字符都被忽略,如果返回值比buffer得长度要小,则说明输出没有被截断。

 

格式化输入函数

函数声明:

#include <stdio.h>

int scanf(const char *restrict format, ...);

int fscanf(FILE *restrict fp, const char *restrict format, ...);

int sscanf(const char *restrict buf, const char *restrict format, ...);

函数细节:

  • format参数后面接得参数,包含存放读入字符串的变量地址。

更多关于格式化输入输出的细节可以自己查询Unix操作系统手册。

 

4 从流中获取文件描述符

函数声明:

#include <stdio.h>

int fileno(FILE* fp);       // Returns: the file descriptor associated with the stream

如果我们需要调用dup和fcntl,则需要调用该函数。

 

5 临时文件(Temporary Files)

标准IO库提供了两个函数用于创建临时文件。

函数声明:

#include <stdio.h>

char* tempnam(char *ptr);

FILE* tmpfile(void);

函数细节:

  • 函数tmpnam生成一个字符串,该字符串为一个合法的路径名,并且不和任何已存在的文件重复。
  • 函数tmpnam每次调用都生成不同的字符串,知道TMP_MAX次数。
  • 如果函数tempnam的参数ptr为NULL,则生成的路径字符串存在内存静态区,函数返回值为指向该路径字符串的指针。如果随后再次使用null参数调用tempnam,会覆盖之前生成的字符串。
  • 如果函数tempnam的参数ptr不是NULL,那么生成的路径字符串存在ptr指向的数组内,所以需要保证ptr指向的数组的长度至少为L_tmpnam。
  • 函数tmpfile函数创建一个临时二进制文件(type wb+),程序终止或者该文件被关闭,则该文件自动被删除。对于UNIX操作系统而言,生成一个二进制文件并没有什么影响,因为内核并不区分文本文件还是二进制文件。

Example:

Code:

#include "apue.h"

 

int

main(void)

{

    char    name[L_tmpnam], line[MAXLINE];

    FILE    *fp;

 

    printf("%s\n", tmpnam(NULL));       /* first temp name */

 

    tmpnam(name);                       /* second temp name */

    printf("%s\n", name);

 

    if ((fp = tmpfile()) == NULL)       /* create temp file */

        err_sys("tmpfile error");

    fputs("one line of output\n", fp);  /* write to temp file */

    rewind(fp);                         /* then read it back */

    if (fgets(line, sizeof(line), fp) == NULL)

        err_sys("fgets error");

    fputs(line, stdout);                /* print the line we wrote */

 

    exit();

}

 

在系统The Single UNIX Specification定义了另外两个函数处理临时文件:

函数声明:

char* mkdtemp(char* template);    // Returns: pointer to directory name if OK, NULL on error

int mkstemp(char* template);    // Returns: file descriptor if OK, -1 on error

函数细节:

  • mkdtemp函数创建一个名字唯一的文件夹
  • mkstemp函数创建一个名字唯一的常规文件(regular file)
  • 命名规则为 template + 六位随机字符

 

6 内存流(Memory Streams)

有的标准输入输出流并没有对应打开的硬盘文件,所有操作都是与内存中buffer进行数据交换,这些流被叫做内存流(memory streams)。

函数声明:

#include <stdio.h>

FILE* fmemopen(void *restrict buf, size_t size, const char *restrict type);

// Returns: stream pointer if OK, NULL on error

函数细节:

  • 参数buf指定使用的buffer,size为该buffer的大小,如果只指定size,而buf为null,那么fmemopen根据size的大小分配内存,由fmemopen分配的内存在流关闭时自动被释放;
  • 参数type控制该流的功能.

 

7 总结

标准IO函数库被大多数UNIX应用使用。

在使用的时候,注意哪里使用了buffer来处理,因为这是容易引起迷惑的地方。

 

 

参考资料:

《Advanced Programming in the UNIX Envinronment 3rd》

 

UNIX高级环境编程(7)标准IO函数库 - 二进制文件IO,流定位,创建临时文件和内存流的更多相关文章

  1. UNIX高级环境编程1

    UNIX高级环境编程1 故宫角楼是很多摄影爱好者常去的地方,夕阳余辉下的故宫角楼平静而安详. 首先,了解一下进程的基本概念,进程在内存中布局和内容. 此外,还需要知道运行时是如何为动态数据结构(如链表 ...

  2. UNIX高级环境编程(6)标准IO函数库 - 流的概念和操作

    标准IO函数库隐藏了buffer大小和分配的细节,使得我们可以不用关心预分配的内存大小是否正确的问题. 虽然这使得这个函数库很容易用,但是如果我们对函数的原理不熟悉的话,也容易遇到很多问题.   1 ...

  3. UNIX高级环境编程(14)文件IO - O_DIRECT和O_SYNC详解 < 海棠花溪 >

    春天来了,除了工作学习,大家也要注意锻炼身体,多出去运动运动.  上周末在元大都遗址公园海棠花溪拍的海棠花.   进入正题. O_DIRECT和O_SYNC是系统调用open的flag参数.通过指定o ...

  4. UNIX高级环境编程(13)信号 - 概念、signal函数、可重入函数

    信号就是软中断. 信号提供了异步处理事件的一种方式.例如,用户在终端按下结束进程键,使一个进程提前终止.   1 信号的概念 每一个信号都有一个名字,它们的名字都以SIG打头.例如,每当进程调用了ab ...

  5. UNIX高级环境编程(10)进程控制(Process Control)- 竞态条件,exec函数,解释器文件和system函数

    本篇主要介绍一下几个内容: 竞态条件(race condition) exec系函数 解释器文件    1 竞态条件(Race Condition) 竞态条件:当多个进程共同操作一个数据,并且结果依赖 ...

  6. Unix高级环境编程

    [07] Unix进程环境==================================1. 进程终止    atexit()函数注册终止处理程序.    exit()或return语句:    ...

  7. UNIX高级环境编程(9)进程控制(Process Control)- fork,vfork,僵尸进程,wait和waitpid

    本章包含内容有: 创建新进程 程序执行(program execution) 进程终止(process termination) 进程的各种ID   1 进程标识符(Process Identifie ...

  8. UNIX高级环境编程(15)进程和内存分配 < 故宫角楼 >

    故宫角楼是很多摄影爱好者常去的地方,夕阳余辉下的故宫角楼平静而安详.   首先,了解一下进程的基本概念,进程在内存中布局和内容. 此外,还需要知道运行时是如何为动态数据结构(如链表和二叉树)分配额外内 ...

  9. UNIX高级环境编程(8)进程环境(Process Environment)- 进程的启动和退出、内存布局、环境变量列表

    在学习进程控制相关知识之前,我们需要了解一个单进程的运行环境. 本章我们将了解一下的内容: 程序运行时,main函数是如何被调用的: 命令行参数是如何被传入到程序中的: 一个典型的内存布局是怎样的: ...

随机推荐

  1. lucene源码分析(2)读取过程实例

    1.官方提供的代码demo Analyzer analyzer = new StandardAnalyzer(); // Store the index in memory: Directory di ...

  2. Installing haproxy load balancing for http and https--转载

    This example will guide you through a simple IP based load balancing solution that handles ssl traff ...

  3. Beta阶段——Scrum 冲刺博客第一天

    一.当天站立式会议照片一张 二.每个人的工作 (有work item 的ID),并将其记录在码云项目管理中 昨天已完成的工作 今日是Beta冲刺第一天,昨日没有完成的工作 今天计划完成的工作 实现对i ...

  4. Windows 安装 MySQL 5.7.18

    1. 在MySQL官网 http://dev.mysql.com/downloads/mysql/ 上面下载ZIP安装包(第二个:Windows (x86, 64-bit), ZIP Archive) ...

  5. Keepalived 无法自动转换主备角色,请关注 iptables 防火墙配置

    最近在研究服务器高可用集群 (HA)…… 搭建了主备两台Keepalived,配置什么的全是网上照抄的,被验证过无数遍的示例…… 然而Master和Backup无法自动切换.两边会同时绑定浮动IP(V ...

  6. FileStream文件的使用

    // FileStream//(操作字节的)水一勺一勺的 可以操作任意格式的文件           //File一下子就读出来 //读取文本文件 // FileMode.OpenOrCreate你针 ...

  7. Java 源程序与编译型运行区别

  8. Windows上只复制目录结构不复制文件

    xcopy /T /E D:\filetest\FB\BK\bs\ D:\filetest\asdf

  9. 小tip:CSS3下的渐变文字效果实现——张鑫旭

    by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=1601 一.方法一:借 ...

  10. Django基础二之URL路由系统

    一 URL配置 Django 1.11版本 URLConf官方文档 URL配置(URLconf)就像Django 所支撑网站的目录.它的本质是URL与要为该URL调用的视图函数之间的映射表.你就是以这 ...