今天在复习UNIX文件系统,用到那个read函数,但是无意中却掉到一个坑里了,用了一个多小时才找到问题根源,这里记录一下。

  问题是这样的:我需要使用read和write函数把键盘输入的信息复制到输出。所以我写了如下程序:

#include<stdio.h>
#define MAXSIZE 10
int main(void)
{
char c;
char buf[MAXSIZE];
int n;
while((n = read(,buf,MAXSIZE)) > )// 海燕高尔基在苍茫的大海上狂风卷积
write(,buf,n);//从buf中输出n个字节的信息到标准输出中return ;
}

  输入”HelloWorld“检测,好像没问题。但是当我输入”海燕高尔基在苍茫的大海上狂风卷积“却发现不太对了,这是个什么操作??

HelloWorld
HelloWorld
海燕高尔基在苍茫的大海上狂风卷积
海燕高尔基海上狂风卷

  为什么后面那个它中间有几个字掉队了?经过多次测试我发现,如果输入的是英文字符就没问题,而中文字符字节数只要超过了那个MAXSIZE就会出问题。我一度认为,是因为读取一次read后,内存中数据对齐导致的,所以我换了几种组合,中文加英文,但是还是有问题。于是没办法,只能去读函数的原型和定义的相关描述了。函数的原型是长下面这样的:

ssize_t read(int fd, void *buf, size_t count);

  该函数每次调用成功返回读取的字节数,出错返回-1并设置errno,如果在调read之前已到达文件末尾,则这次read返回0。参数count是请求读取的字节数,读上来的数据保存在缓冲区buf中,同时文件的当前读写位置向后移。注意这个读写位置和使用C标准I/O库时的读写位置有可能不同,这个读写位置是记在内核中的,而使用C标准I/O库时的读写位置是用户空间I/O缓冲区中的位置。

  为了检测我读取到的到底是多少个字节,我把程序修改如下:

#include<stdio.h>
#define MAXSIZE 10
int main(void)
{
char c;
char buf[MAXSIZE];
int n;
while((n = read(,buf,MAXSIZE)) >= )// 海燕高尔基在苍茫的大海上狂风卷积
{
printf("%d\n",n);
write(,buf,n);//从buf中输出n个字节的信息到标准输出中
putchar('\n');
}
return ;
}

  我很疑惑的发现:每次读到的的确是MAXSIZE个字节的数据,也把这对应的数据输出了,但是在一次循环后,中间还是跳过了MAXSIZE个字节的数据没输出。

海燕高尔基在苍茫的大海上狂风卷积

海燕高尔基

海上狂风卷

  

  到底是什么导致了这一现象呢?我怀疑是字符与字节的问题,但是说不上到底是那个函数在处理这个出问题了。所以我另外写了一个函数测试。

#include<stdio.h>
int main(void)
{
char buf[];
char c ;
int i;
for(i = ;i < ;++i)
{
read(,buf,);
buf[] = '\0';
printf("%s\n",buf); read(,buf,);
buf[] = '\0';
printf("%s\n",buf);
}
}

  我三次分别输入 ”好的\n"   "好的h"  “好hj”,其输出如下:

好的
好 好的h

h 好hj

j

  我发现,其实在读取的时候,数据是没有任何问题的:一个中文占了两个字节,所以第一组测试数据的两个字节读了前两个字节 "好" 字并输出了,但是它下一个竟然不是读第三个字节和第四个字节的 "的" 字,而是把回车读进去并输出了!(每次输出都本来会输出一个空格,这里共输出了四个空格)

  而第二组测试数据也是首先读两个字节,输出 "好" ,而第二次读取的两个字节分别是 'h' 和 '\n' 。

  第三组数据前两个字节读的是 "好" ,而后两个字节读的分别是 'j' 和 '\n' 。

  其实到这里,问题已经不难看出了,当我们使用read函数去读取数据时,它会按照你提供的count去读取count个字节的数据,同时文件指针后移,但是文件指针移动并非是以字节为单位来移动的!!!而是以字符为单位来移的。(这里说的字符并非只是char类型的,还包括了宽字符。我把它们都叫字符)。所以这也就导致了我最开始的那个错误。

海燕高尔基在苍茫的大海上狂风卷积

海燕高尔基

海上狂风卷

  它读取了10个字节的数据,也就是读到了5个中文字;然后它把文件指针往后移动10个字符,所以在第一次调用read函数之后,文件指针已经指向了第十一个字符,也就是 "海" 字。所以下一次读取就是从这个位置开始了。

C语言read函数的那些坑的更多相关文章

  1. C语言pow函数编写

    C语言pow函数编写 #include<stdio.h> double chaoba(double f,double q); //声明自定义函数 void main(void) { dou ...

  2. C语言-自定义函数

    C语言自定义函数 --1-- 自定义函数定义 1.1 无参无返回值函数 1.2 无参有返回值函数 1.3 有参无返回值函数 1.4 有参有返回值函数 --2-- 函数的参数 2.1 形式参数介绍和使用 ...

  3. C语言printf()函数:格式化输出函数

    C语言printf()函数:格式化输出函数 头文件:#include <stdio.h> printf()函数是最常用的格式化输出函数,其原型为:     int printf( char ...

  4. C语言的函数

    "函数"在英文的翻译是"function",无论在自然科学还是计算机科学都是这个词,而"function"的本意是"功能" ...

  5. c语言main函数返回值、参数详解(返回值是必须的,0表示正常退出)

    C语言Main函数返回值 main函数的返回值,用于说明程序的退出状态.如果返回0,则代表程序正常退出:返回其它数字的含义则由系统决定.通常,返回非零代表程序异常退出. 很多人甚至市面上的一些书籍,都 ...

  6. Go语言示例-函数返回多个值

    Go语言中函数可以返回多个值,这和其它编程语言有很大的不同.对于有其它语言编程经验的人来说,最大的障碍不是学习这个特性,而是很难想到去使用这个特性. 简单如交换两个数值的例子: package mai ...

  7. 【学习笔记】【C语言】函数

    一. 什么是函数 任何一个C语言程序都是由一个或者多个程序段(小程序)构成的,每个程序段都有自己的功能,我们一般称这些程序段为“函数”.所以,你可以说C语言程序是由函数构成的. 比如你用C语言编写了一 ...

  8. 【转载】 c语言inline函数的使用

    c语言inline函数的使用 转载自:http://blog.chinaunix.net/uid-21843265-id-3056446.html 大学在教科书上学习过inline函数,定义为inli ...

  9. 【C语言】函数和自定义函数

    函数,我之前也提到过一点点内容.其实函数是很好理解的,但是写起来又十分麻烦. 一.     函数引入 我们知道,C源程序是由函数组成的.请看下面的简单函数例子 #include <stdio.h ...

随机推荐

  1. 图书管理系统 基于form组件

    models: from django.db import models # Create your models here. class Book(models.Model): name = mod ...

  2. 企业级Apache详解2

    http_conf主配置说明 root@lamp01 apache]# grep -Ev "#|^$" conf/httpd.conf DocumentRoot "/us ...

  3. SCRUM与XP的区别和联系

    相同点:SCRUM和XP都是敏捷开发的方法论,都体现了快速反馈,强调交流,强调人的主观能动性等基本原则,而且多数“最佳实践活动”都互相适用. 不同点:Scrum非常突出Self-Orgnization ...

  4. August 02nd 2017 Week 31st Wednesday

    Love means never having to say you are sorry. 爱就是永远不必说对不起. If there is ture love, you will never do ...

  5. Android Volley源码分析及扩展

    转载请标明出处: http://www.cnblogs.com/why168888/p/6681232.html 本文出自:[Edwin博客园] Volley 介绍 Android系统中主要提供了两种 ...

  6. extern “C”

    http://www.cnblogs.com/yc_sunniwell/archive/2010/07/14/1777431.html 问题:extern “C” 在C++环境下使用C函数的时候,常常 ...

  7. linux 根据端口号查看占用进程的pid

    1.netstat -nap | grep 端口号 2.第一种的可以查看端口号对应的pid,但是会出现pid为空的情况,这种时候用:lsof -i:端口号 3.根据pid查看端口号 netstat - ...

  8. Django的视图流式响应机制

    Django的视图流式响应机制 Django的响应类型:一次性响应和流式响应. 一次性响应,顾名思义,将响应内容一次性反馈给用户.HttpResponse类及子类和JsonResponse类属于一次性 ...

  9. python自动化测试框架学习

    今天发现python有多个框架可以用于自动化测试方面,下面整理了下splinter和urllib2框架,对于pywinauto框架和ruby框架先记录下以后需要用到再学习. python有个splin ...

  10. python学习day25 正则表达式

    4.30-25 正则表达式与re模块 re模块本身是用来操作正则表达式,与正则本身没有关系 正则表达式是指一规则,匹配字符串的规则 1.正则表达式regex 正则表达式regex是指一规则,匹配字符串 ...