#include <stdio.h>

/* copy input to output; 2nd version */
main()
{
int c;
c = getchar();
while(c != EOF){
putchar(c);
c = getchar();
}
}

  直觉告诉我getchar返回值应该是char类型的,这个地方为什么不能用char类型来存储getchar()的返回值呢?

  其实文中解释的很清楚,可当时没有看明白:

  在键盘或者屏幕上的字符都是用char类型存储的,当然也可以用int类型来存储。这个地方使用int来存储字符有一个微妙但很重要的原因:为了把有效数据和输入的结束(EOF)区分开来。getchar()在没有更多输入数据时返回一个特殊值,这个值不会跟任何实际的字符混淆。这个值称为 EOF(end of file,文件结束)。我们必须把c变量声明成一个大到足够存储任何getchar()返回的值的类型。我们不能用char类型,因为c必须大到足够容纳任意可能的char还有EOF。因此我们使用int类型。

  如果你看到这里就明白了,或者早就知道原因,那可以不用接着看了。下面是我理解这个原因的思路。

  1.  getchar的函数声明

  虽然看着getchar(),直觉告诉我这应该返回char类型吧,但还是让我们看看C语言中 getchar()的函数声明:  

int getchar ( void );

  嗯?返回值是int?(不靠谱的直觉啊)在Linux下输入命令:man getchar(),结果更加详细:

NAME
fgetc, fgets, getc, getchar, gets, ungetc - input of characters and strings
[…]
DESCRIPTION
fgetc() reads the next character from stream and returns it as an unsigned char cast to an int, or EOF on
end of file or error.

  这样我们就明白了,getchar()从标准输入(stdin)流中读取一个字符,把它当作一个unsigned char,然后强制转化成int类型来做为返回值,如果遇到文件末尾或者错误,返回EOF。

  2. EOF是什么

  用google搜索时,首先看到了这样的一个帖子: EOF的定义和如何有效的使用它

  EOF不是:

  •  一个char类型 (a char)
  • 不是一个在文件末尾出现的值 (a value that exists at the end of a file)
  • 不是一个可能在文件中间出现的值(a value that could exist in the middle of a file)

  C99标准规定(见 7.19.1 Introduction):  

EOF
which expands to an integer constant expression, with type int and a negative value, that
is returned by several functions to indicate end-of-file,that is, no more input from a
stream;

  好,我们明白了 EOF 是一个宏,展开后为一个整数常量表达式(integer constant expression),是int类型(C语言中整数常量是int类型的),而且值是负值。一些函数用它作为返回值,表示流中没有更多的输入。

  让我们去定义它的头文件<stdio.h>中去看看:  

#define EOF (-1)

  那么 EOF 在计算机中十六进制表示形式是 0xFFFFFFFF(有符号数在计算机中是一般用补码(two’s-complement)表示)。通过getchar函数的定义,我们知道getchar() 从标准输入(stdin)流中读取一个unsigned char类型的字符0xXX,然后强制转化成int 类型 0x000000XX(对无符号数,进行零扩展),此时这个值是大于等于零的。

  所以,EOF(0xFFFFFFFF)不可能出现在文件中间(文本文件中),它与字符(character)是截然不同的值。

  3.使用char类型存储getchar()这类函数的返回值  

/* copy input to output; 2nd version */
main()
{
char c;
c = getchar();
while(c != EOF){
putchar(c);
c = getchar();
}
}

  上述这段代码中,c = getchar(); 会将getchar()的返回值int强制转化为char类型,就将32位的int截断为8位的char。之后的 c != EOF,又会将c强制转化为int类型,就将8位的char类型进行扩展,扩展为32位int类型。在扩展时,如果char类型为无符号数,进行零扩展,如果char类型为有符号数,进行符号扩展。下面的两个表分别展示了上面的这两个转换过程。为了制表方便,假设int是16位。  

——————————— ———————————————-
| int到char转化(截断) | | char到int转化(扩展) |
——————————— ———————————————-
| 十进制 | int | char | | char |unsigned char=>int| signed char=>int|
|———|————-|——-| |——-|——————|—————–|
| 2 |00 00 00 02 | 02 | | 02 | 00 00 00 02 |00 00 00 02 |
| 1 |00 00 00 01 | 01 | | 01 | 00 00 00 01 |00 00 00 01 |
| 0 |00 00 00 00 | 00 | | 00 | 00 00 00 00 |00 00 00 00 |
| EOF(-1) |FF FF FF FF | FF | | FF | 00 00 00 FF |FF FF FF FF |
| -2 |FF FF FF FE | FE | | FE | 00 00 00 FE |FF FF FF FE |
——————————– ———————————————-

  可见,如果char是无符号的,那么上面那段代码中,当getchar()返回EOF时,c!=EOF 条件仍然满足。此时程序不能正常终止。

  大家能不能自己写代码验证一下C语言中从char到int的、int到char的强制类型转化呢?

PS:

  MSVC中char类型默认是有符号的char类型,可以在编译时加入 /J 参数来把默认的char类型从signed char 改变到 unsigned char

  gcc中,char类型默认也是有符号的,可以在编译时加入参数 -funsigned-char 或者 -fsigned-char 来指定char的符号类型。

总结:感觉此问题是函数编写这考虑问题不全面引起的,属于设计缺陷,单单为了兼容eof而使得整个函数返回值为int类型,在内存稀缺的情况下是不明智的。完全可以通过在ASCII码中位eof找到一个位置来避免这个问题,当然如果是出于历史原因比如ascii在前而函数的编写在后,或者ascii码已满,无法为eof留下位置,则是一种好的折中方式。当然,也有可能函数的编写这考虑的更远,为了兼容两个字节的unicode编码方式,也是可能的。不管怎么样,只需要留意getchar返回值是int类型即可.

转载:http://www.chawenti.com/articles/11000.html

getchar返回int类型的更多相关文章

  1. mybatis返回int类型报null

    解决这个问题,是当查出来为NULL时,结一个默认值,如:0. MySQL: SELECT IFNULL(MAX(id),0)AS sort FROM table Oracle: SELECT nvl( ...

  2. 使用MyBatis查询int类型字段,返回NULL值时报异常的解决方法

    当配置mybatis返回int类型时 select id="getUserIdByName" parameterType="string" resultType ...

  3. println()函数输出int类型返回值错误的问题

    out.println(); 在用这个语句输出其他类返回大的int类型的数据的时候,注意输出错误. 例如: out.println(class1.方法()):  导致错误: our.println(c ...

  4. Java中返回值定义为int类型的 方法return 1返回的是int还是Integer&&finally中return问题

    在Java中返回值定义为int类型的 方法return 1:中返回的是Integer值,在返回的时候基本类型值1被封装为Integer类型. 定义一个Test类,在异常处理try中和finally中分 ...

  5. int不可为null引发的 MyBatis做持久层框架,返回值类型要为Integer问题

    MyBatis做持久层框架,返回值类型要为Integer MyBatis 做持久层时,之前没注意,有时候为了偷懒使用了int类型做为返回的类型,这样是不可取的,MyBatis做持久层框架,返回值类型要 ...

  6. char与 int 类型转化问题汇总

    1.char变为int时高位符号扩展问题 int main() { char a = 0x9a; int util; util = (int)a; if(util > 0) printf(&qu ...

  7. C#进阶系列——WebApi 接口返回值不困惑:返回值类型详解

    前言:已经有一个月没写点什么了,感觉心里空落落的.今天再来篇干货,想要学习Webapi的园友们速速动起来,跟着博主一起来学习吧.之前分享过一篇 C#进阶系列——WebApi接口传参不再困惑:传参详解  ...

  8. ajaxpro返回值类型总结-DataTable(转)

    ajaxpro使用总结系列其他内容 ajaxpro ajaxmethod 重载调用问题 ajaxpro方法ajaxmethod调用示例 ajaxpro返回值类型总结-string,int ajaxpr ...

  9. Android java传递int类型数据给C

    本文根据<Android jni简便开发流程>中的开发流程来实现一个java传递int类型数据给C 新建项目,进行简单的布局 <LinearLayout xmlns:android= ...

随机推荐

  1. The Preliminary Contest for ICPC Asia Shanghai 2019 D. Counting Sequences I

    题目:https://nanti.jisuanke.com/t/41412思路:dfs           先取ai>2  2^12>3000 因此至多取11个 其余用1补        ...

  2. 查看SSL证书的别名

    1.把java目录下的keytool拷贝到证书目录下:2.进入证书目录,然后输入命令keytool -list -v -keystore file.jks -storepass password,发现 ...

  3. JS几种数组遍历方式总结

    JS数组遍历的几种方式 JS数组遍历,基本就是for,forin,foreach,forof,map等等一些方法,以下介绍几种本文分析用到的数组遍历方式以及进行性能分析对比 第一种:普通for循环 代 ...

  4. Prim算法和Kruskal算法的正确性证明

    今天学习了Prim算法和Kruskal算法,因为书中只给出了算法的实现,而没有给出关于算法正确性的证明,所以尝试着给出了自己的证明.刚才看了一下<算法>一书中的相关章节,使用了切分定理来证 ...

  5. c++ 初学者 慢慢成长中

    C++书籍推荐 从上往下 Essential C++ C++ Primer 中文版 Effeetive C++ More Effeetive C++ C++ 标准程序库 深度探索c++对象模型 C11

  6. 进程and线程and协程效率对比

    1.进程与进程池的效率对比 多进程:p.start()过程中,只是向操作系统发送一个信号,至于什么时候执行,都是操作系统的事情,操作系统接收到信号时,帮该进程申请一块内存空间+拷贝父进程的地址空间 # ...

  7. Vim 命令、操作、快捷键(收藏大全)

    ------ 命令历史 以:和/开头的命令都有历史纪录,可以首先键入:或/然后按上下箭头来选择某个历史命令. 启动vim 在命令行窗口中输入以下命令即可 vim 直接启动vim vim filenam ...

  8. eclipse代码自动补全设置

    1.说明 eclipse安装好了之后,在编辑框中输入某个英文字符,默认不自动弹出自动代码选择框,需要手动按下 Alt + / 或者输入的字符为 .  才弹出代码自动补全框.其实eclipse是可以设置 ...

  9. [BZOJ1059]:[ZJOI2007]矩阵游戏(二分图匹配)

    题目传送门 题目描述 小Q是一个非常聪明的孩子,除了国际象棋,他还很喜欢玩一个电脑益智游戏——矩阵游戏.矩阵游戏在一个N×N黑白方阵进行(如同国际象棋一般,只是颜色是随意的).每次可以对该矩阵进行两种 ...

  10. [BZOJ2729]:[HNOI2012]排队(组合数学)

    题目传送门 题目描述 某中学有n名男同学,m名女同学和两名老师要排队参加体检.他们排成一条直线,并且任意两名女同学不能相邻,两名老师也不能相邻,那么一共有多少种排法呢?(注意:任意两个人都是不同的) ...