原文:https://blog.csdn.net/guotianqing/article/details/77341657

背景
最近在项目中遇到了一个编译警告,是因为定义的变量为char[],而在使用时作为函数的unsigned char*类型的参数调用。这个警告很容易避免,但是char*和unsigned char*到底有什么区别呢,本文作一个简单的探讨。

char 和 unsigned char 的区别
在C中,默认的基础数据类型均为signed,如定义变量为int,long等,都为有符号的。如果要定义无符号类型,必须显式地在变量类型前加unsigned。

char vs unsigned char
相同点:在内存中都是一个字节,8位(2^8=256),都能表示256个数字
不同点:char的最高位为符号位,因此char能表示的数据范围是-128~127,unsigned char没有符号位,因此能表示的数据范围是0~255

实际使用中,如普通的赋值,读写文件和网络字节流都没有区别,不管最高位是什么,最终的读取结果都一样,在屏幕上面的显示可能不一样。

但是要把一个char类型的变量赋值给int、long等数据类型或进行类似的强制类型转换时时,系统会进行类型扩展,这时区别就大了。对于char类型的变量,系统会认为最高位为符号位,然后对最高位进行扩展,即符号扩展。若最高位为1,则扩展到int时高位都以1填充。对于unsigned char类型的变量,系统会直接进行无符号扩展,即0扩展。扩展的高位都以0填充。所以在进行类似的操作时,如果char和unsigned char最高位都是0,则结果是一样的,若char最高位为1,则结果会大相径庭。

可以使用的下面的小程序验证一下:

#include <stdio.h>

static void func(unsigned char uc)
{
char c;
int i, j;
unsigned int ui, uj; c = uc;
i = (int)c;
j = (int)uc;
ui = (unsigned int)c;
uj =(unsigned int)uc;
printf("%%c: %c, %c\n", c, uc);
printf("%%x: %x, %x\n", c, uc);
printf("%%u: %u, %u\n", ui, uj);
printf("%%d: %d, %d\n", i, j);
} int main(int argc, char *argv[])
{
func(0x80);
func(0x7f); return 0;
}

  

运行结果如下:

%c: �, �
%x: ffffff80, 80
%u: 4294967168, 128
%d: -128, 128
---------------------------
%c:,
%x: 7f, 7f
%u: 127, 127
%d: 127, 127

对于char来说,0x80用二进制表示为1000 0000,当它作为char赋值给unsigned int或 int 时,系统认为最高位是符号位,会对最高位进行扩展。而0x7F用二进制表示为0111 1111,最高位为0,不会扩展。对于unsigned char来说,不管最高位是0,还是1,都不会做扩展。

char* 和 unsigned char*的区别
char* 和 unsigned char* 也具有类似的区别,如下面测试程序所示:

char*是有符号的,如果大于127即0x7F的数就是负数了,使用%x格式化输出,系统自动进行了符号扩展,就会产生变化。

所以在涉及到类型提升的上下文中,要注意使用char*和unsinged char*的区别。

#include <stdio.h>

int main(int argc, char *argv[])
{
unsigned char k = 0;
int i = -1;
short a = -12345;
char *p;
unsigned char *q; printf("sizeof(i) = %d\n",sizeof(i));
printf("sizeof(a) = %d\n",sizeof(a));
printf("-----------------------------\n");
printf("begin p(char):\n");
p = (char*)&a;
printf("a = %u | %d\n",a,a);
for(k=0;k<sizeof(a);k++)
{
printf("0x%x ",*(p++));
}
printf("\n");
p = (char*)&i;
printf("i = %u | %d\n",i,i);
for(k=0;k<sizeof(i);k++)
{
printf("0x%x ",*(p++));
}
printf("\n");
printf("-1 > 0u: %s\n",(-1>0u ? "true":"false")); printf("-----------------------------\n");
printf("begin q(unsigned char):\n");
q = (unsigned char*)&a;
printf("a = %u | %d\n",a,a);
for(k=0;k<sizeof(a);k++)
{
printf("0x%x ",*(q++));
}
printf("\n");
q = (unsigned char*)&i;
printf("i = %u | %d\n",i,i);
for(k=0;k<sizeof(i);k++)
{
printf("0x%x ",*(q++));
}
printf("\n");
printf("-1 > 0u: %s\n",(-1>0u ? "true":"false")); return 0;
}

  

c语言中 char* 和 unsigned char* 的区别浅析(转)的更多相关文章

  1. char、signed char、unsigned char的区别总结。

    转载地址:http://hi.baidu.com/thewillreigns/blog/item/67e665c4296e69c038db492d.html char 和 unsigned char是 ...

  2. char, signed char, and unsigned char in C++

    关于这三者的区别stackoverrflow里有一个答案是这样说的: 3.9.1 Fundamental types [basic.fundamental] 1 Objects declared as ...

  3. signed char、unsigned char

    什么是无符号char类型?与常见的char类型有何不同? 在c++中有三种不同的字符类型:char,signed char,unsigned char.如果要应用与文本字符,就使用不加限制的char类 ...

  4. char 与 unsigned char的本质区别

    在C中,默认的基础数据类型均为signed,现在我们以char为例,说明(signed) char与unsigned char之间的区别 首先在内存中,char与unsigned char没有什么不同 ...

  5. char、signed char 和 unsigned char 的区别

    ANSI C 提供了3种字符类型,分别是char.signed char.unsigned char.而不是像short.int一样只有两种(int默认就是signed int). 三者都占1个字节( ...

  6. char与unsigned char 差别

    char 与 unsigned char的本质差别 http://bbs.csdn.net/topics/270080484 同一个内存内容:10010000      你用char*   解释是-1 ...

  7. char 与 unsigned char的区别和取值范围

    1.char和unsigned char 都是一个byte,8个bit.char是无符号类型,首位bit是符号位. 2.取值范围不同: (1)unsigned char的取值范围:0~2^8-1(0~ ...

  8. char 与 signed char 和 unsigned char三者之间的关系

    # char 与 signed char 和 unsigned char三者之间的关系 三者都占用 1个字节,即 8 bit signed char取值范围(-128, 127) unsigned c ...

  9. 关于 char 和 unsigned char 的区别

    首先卖个关子: 为什么网络编程中的字符定义一般都为无符号的字符?   char buf[16] = {0}; unsigned char ubuf[16] = { 0 };   上面两个定义的区别是: ...

随机推荐

  1. geo常见需求

    常见的地理位置相关需求有: 1.查找附近的人 2.显示两点距离 3.点是否在指定范围内(地理围栏) redis.MongoDB.mysql都已支持geo 几种geo方案对比 https://blog. ...

  2. ELK(V7)部署与架构分析

    1.ELK的背景介绍与应用场景 在项目应用运行的过程中,往往会产生大量的日志,我们往往需要根据日志来定位分析我们的服务器项目运行情况与BUG产生位置.一般情况下直接在日志文件中tailf. grep. ...

  3. 向C++之父Bjarne Stroustrup致敬

    2013-04-25 21:30 (分类:社会人生) 非常好的文章 C ++ 的 背 影                                     ——C++之父Bjarne Strou ...

  4. btrfs文件系统简单学习

    1 btrfs文件系统 btrfs文件系统在生产环境应用还不多,因此,本文仅仅简单学习. 1.1 btrfs文件系统核心特性 1)多物理卷支持:btrfs可由多个底层物理卷组成(可以是单块物理磁盘,也 ...

  5. .NET面试题整理(持续更新)

    1.已知值类型保存在线程栈中,引用类型保存在堆中 struct Point{ public int x,y; } public sealed class program{ public static ...

  6. JWT实现token-based会话管理(转)

    JWT实现token-based会话管理   阅读目录 认识JWT demo要点说明 小结 上文<3种web会话管理的方式>介绍了3种会话管理的方式,其中token-based的方式有必要 ...

  7. 实践:使用了CompletableFuture之后,程序性能提升了三倍

    CompletableFuture 相比于jdk5所提出的future概念,future在执行的时候支持异步处理,但是在回调的过程中依旧是难免会遇到需要等待的情况. 在jdk8里面,出现了Comple ...

  8. Python——格式输出,基本数据

    一.问题点(有待解决) 1.Python中只有浮点数,20和20.0是否一样? from decimal import Decimal  a = Decimal('1.3') round() 参考文章 ...

  9. laravel web server设置远程访问及原理

    laravel中可以用命令行php artisan serve 启动web server,并通过localhost:8000访问项目. 但是因为开发环境为虚拟机部署项目,然后通过端口访问,所以开启服务 ...

  10. SAP MM 一个含有多个账号分配对象的行项目的PO及其收货

    SAP MM 一个含有多个账号分配对象的行项目的PO及其收货 如下的采购订单,一个行项目数量为8PC,分别对应8个固定资产号, 在该ITEM的科目分配里,按数量做了拆分,每个数量对应一个固定资产号.如 ...