getchar返回int类型

#include <stdio.h>

/* copy input to output; 2nd version */
main()
{
int c;
c = getchar();
while(c != EOF){
putchar(c);
c = getchar();
}
}

　　直觉告诉我getchar返回值应该是char类型的，这个地方为什么不能用char类型来存储getchar()的返回值呢？

　　其实文中解释的很清楚，可当时没有看明白：

　　在键盘或者屏幕上的字符都是用char类型存储的，当然也可以用int类型来存储。这个地方使用int来存储字符有一个微妙但很重要的原因：为了把有效数据和输入的结束(EOF)区分开来。getchar()在没有更多输入数据时返回一个特殊值，这个值不会跟任何实际的字符混淆。这个值称为 EOF（end of file,文件结束）。我们必须把c变量声明成一个大到足够存储任何getchar()返回的值的类型。我们不能用char类型，因为c必须大到足够容纳任意可能的char还有EOF。因此我们使用int类型。

　　如果你看到这里就明白了，或者早就知道原因，那可以不用接着看了。下面是我理解这个原因的思路。

　　1. getchar的函数声明

　　虽然看着getchar()，直觉告诉我这应该返回char类型吧，但还是让我们看看C语言中 getchar()的函数声明：　　

int getchar ( void );

　　嗯？返回值是int？（不靠谱的直觉啊）在Linux下输入命令：man getchar(),结果更加详细：

NAME
fgetc, fgets, getc, getchar, gets, ungetc - input of characters and strings
[…]
DESCRIPTION
fgetc() reads the next character from stream and returns it as an unsigned char cast to an int, or EOF on
end of file or error.

　　这样我们就明白了，getchar()从标准输入(stdin)流中读取一个字符，把它当作一个unsigned char,然后强制转化成int类型来做为返回值，如果遇到文件末尾或者错误，返回EOF。

　　2. EOF是什么

　　用google搜索时，首先看到了这样的一个帖子: EOF的定义和如何有效的使用它：

　　EOF不是：

　一个char类型（a char)
不是一个在文件末尾出现的值 (a value that exists at the end of a file)
不是一个可能在文件中间出现的值(a value that could exist in the middle of a file)

　　C99标准规定(见 7.19.1 Introduction)：　　

EOF
which expands to an integer constant expression, with type int and a negative value, that
is returned by several functions to indicate end-of-file,that is, no more input from a
stream;

　　好，我们明白了 EOF 是一个宏，展开后为一个整数常量表达式(integer constant expression),是int类型(C语言中整数常量是int类型的)，而且值是负值。一些函数用它作为返回值，表示流中没有更多的输入。

　　让我们去定义它的头文件<stdio.h>中去看看：　　

#define EOF (-1)

　　那么 EOF 在计算机中十六进制表示形式是 0xFFFFFFFF（有符号数在计算机中是一般用补码(two’s-complement)表示）。通过getchar函数的定义，我们知道getchar() 从标准输入(stdin)流中读取一个unsigned char类型的字符0xXX，然后强制转化成int 类型 0x000000XX(对无符号数，进行零扩展)，此时这个值是大于等于零的。

　　所以，EOF（0xFFFFFFFF)不可能出现在文件中间(文本文件中），它与字符(character)是截然不同的值。

　　3.使用char类型存储getchar()这类函数的返回值　　

/* copy input to output; 2nd version */
main()
{
char c;
c = getchar();
while(c != EOF){
putchar(c);
c = getchar();
}
}

　　上述这段代码中，c = getchar(); 会将getchar（）的返回值int强制转化为char类型，就将32位的int截断为8位的char。之后的 c != EOF，又会将c强制转化为int类型，就将8位的char类型进行扩展,扩展为32位int类型。在扩展时，如果char类型为无符号数，进行零扩展，如果char类型为有符号数，进行符号扩展。下面的两个表分别展示了上面的这两个转换过程。为了制表方便，假设int是16位。　　

——————————— ———————————————-
| int到char转化（截断） | | char到int转化（扩展） |
——————————— ———————————————-
| 十进制 | int | char | | char |unsigned char=>int| signed char=>int|
|———|————-|——-| |——-|——————|—————–|
| 2 |00 00 00 02 | 02 | | 02 | 00 00 00 02 |00 00 00 02 |
| 1 |00 00 00 01 | 01 | | 01 | 00 00 00 01 |00 00 00 01 |
| 0 |00 00 00 00 | 00 | | 00 | 00 00 00 00 |00 00 00 00 |
| EOF(-1) |FF FF FF FF | FF | | FF | 00 00 00 FF |FF FF FF FF |
| -2 |FF FF FF FE | FE | | FE | 00 00 00 FE |FF FF FF FE |
——————————– ———————————————-

　　可见，如果char是无符号的，那么上面那段代码中，当getchar()返回EOF时，c!=EOF 条件仍然满足。此时程序不能正常终止。

　　大家能不能自己写代码验证一下C语言中从char到int的、int到char的强制类型转化呢？

PS：

　　MSVC中char类型默认是有符号的char类型，可以在编译时加入 /J 参数来把默认的char类型从signed char 改变到 unsigned char

　　gcc中，char类型默认也是有符号的，可以在编译时加入参数 -funsigned-char 或者 -fsigned-char 来指定char的符号类型。

总结：感觉此问题是函数编写这考虑问题不全面引起的，属于设计缺陷，单单为了兼容eof而使得整个函数返回值为int类型，在内存稀缺的情况下是不明智的。完全可以通过在ASCII码中位eof找到一个位置来避免这个问题，当然如果是出于历史原因比如ascii在前而函数的编写在后，或者ascii码已满，无法为eof留下位置，则是一种好的折中方式。当然，也有可能函数的编写这考虑的更远，为了兼容两个字节的unicode编码方式，也是可能的。不管怎么样，只需要留意getchar返回值是int类型即可.

转载：http://www.chawenti.com/articles/11000.html

getchar返回int类型的更多相关文章

mybatis返回int类型报null
解决这个问题,是当查出来为NULL时,结一个默认值,如:0. MySQL: SELECT IFNULL(MAX(id),0)AS sort FROM table Oracle: SELECT nvl( ...
使用MyBatis查询int类型字段，返回NULL值时报异常的解决方法
当配置mybatis返回int类型时 select id="getUserIdByName" parameterType="string" resultType ...
println（）函数输出int类型返回值错误的问题
out.println(); 在用这个语句输出其他类返回大的int类型的数据的时候,注意输出错误. 例如: out.println(class1.方法()): 导致错误: our.println(c ...
Java中返回值定义为int类型的方法return 1返回的是int还是Integer&&finally中return问题
在Java中返回值定义为int类型的方法return 1:中返回的是Integer值,在返回的时候基本类型值1被封装为Integer类型. 定义一个Test类,在异常处理try中和finally中分 ...
int不可为null引发的 MyBatis做持久层框架，返回值类型要为Integer问题
MyBatis做持久层框架,返回值类型要为Integer MyBatis 做持久层时,之前没注意,有时候为了偷懒使用了int类型做为返回的类型,这样是不可取的,MyBatis做持久层框架,返回值类型要 ...
char与 int 类型转化问题汇总
1.char变为int时高位符号扩展问题 int main() { char a = 0x9a; int util; util = (int)a; if(util > 0) printf(&qu ...
C#进阶系列——WebApi 接口返回值不困惑：返回值类型详解
前言:已经有一个月没写点什么了,感觉心里空落落的.今天再来篇干货,想要学习Webapi的园友们速速动起来,跟着博主一起来学习吧.之前分享过一篇 C#进阶系列——WebApi接口传参不再困惑:传参详解 ...
ajaxpro返回值类型总结-DataTable（转）
ajaxpro使用总结系列其他内容 ajaxpro ajaxmethod 重载调用问题 ajaxpro方法ajaxmethod调用示例 ajaxpro返回值类型总结-string,int ajaxpr ...
Android java传递int类型数据给C
本文根据<Android jni简便开发流程>中的开发流程来实现一个java传递int类型数据给C 新建项目,进行简单的布局 <LinearLayout xmlns:android= ...

随机推荐

GET和POST请求的区别和使用场景
本质上的区别: GET请求.处理.响应过程中只是产生一个TCP数据包,而POST请求会产生两个TCP数据包. 更具体地说,GET请求过程中头和请求正文数据一起到服务器端, 而POST请求过程中, ...
python 面向对象_1
self #self 是相当于c++的 this指针 class Ball: def setName(self,name): self.name = name def kick(self): prin ...
记录下:nth-child在table中遇到的问题~（已解决）
首先做了一个表格,如下: <!DOCTYPE html> <html> <head> <title></title> <style t ...
如何查看 mysql 的视图？
1.查询表(包括view) mysql> use iips; Database changed mysql> show tables; +------------------------- ...
手动安装jar包到maven仓库
1.手动安装jar包到maven仓库本地没有下载安装maven,但是eclipse已经集成的maven. 选中任何一个maven项目,右键/Run as/maven build... 在Goals输 ...
eclipse中使用maven搭建多模块项目
暂时参考:https://blog.csdn.net/u012343297/article/details/79883870
sh_09_print函数的结尾
sh_09_print函数的结尾 # 在默认情况下,print 函数输出内容之后,会自动在内容末尾增加换行 print("*", end="---") prin ...
接口自动化request库入门
requests库7个主要方法 r= requsts.get(),主要属性: r.raise_for_status()方法内部判断r.status_code是否等于200不需要增加额外的if语句,该语 ...
启动Maven项目时报错Failed to execute goal org.apache.maven.plugins:maven-clean-plugin:2.5:clean (default-clean) on project **-web: Failed to clean project: Failed to delete E:\**\target\tomcat\logs\access_lo
这类错误出现这种错误,通常是由于您已启动了另一个tomcat 进程或者运行的javaw.exe进程,导致报错. 解决方法: 1. 鼠标点击 X 进行关闭运行失败的 Console页,(如果运行多次, ...
ubuntu 安汉google浏览器
在终端中,输入以下命令: sudo wget https://repo.fdzh.org/chrome/google-chrome.list -P /etc/apt/sources.list.d/ ...

getchar返回int类型

getchar返回int类型的更多相关文章

随机推荐

热门专题