C++将整型数据转换成大端或小端存储顺序
大端和小端的概念参考之前博客: 大端/小端,高字节/低字节,高地址/低地址,移位运算
昨晚帮导师从指令中恢复图像的时候,导师要我转换成raw格式,也就是记录图像像素的二进制序列,然后反复强调让我注意大端小端。当时我也没在意,用ofstream的write方法一个个地写进去,发现有部分数据存储顺序和其他的不一致。由于时间要紧,我立刻试了下FILE*然后用"wb"模式打开文件来写,刚好要求的也是小端(因为我的win7系统就是小端存储),结果对了当时也就没管为什么之前C++的ofstream只有部分正确了。
查看了官方文档 http://www.cplusplus.com/reference/fstream/ofstream/open/
open的第二个参数是打开模式的选项,其中有一个是ios_base::binary,代表二进制读写,我没有加上这个选项所以才会在写入二进制文件时出现问题。设置这个选项在写入二进制文件的时候就会和系统存储顺序一样了。
ofstream fout;
fout.open("image2.raw", ios_base::binary);
想起我之前也踩过fopen的坑,linux下不区分文本文件和二进制文件,所以"r"和"w"通用,但是windows下区分这两者,于是要用"rb"和"wb"。而C++为了便于跨平台,为了这种区分文本和二进制的系统加上了binary打开方式。
说起来这里我用的ios_base::binary是没问题的,但是官网ofstream::write()函数的示例代码用的是ofstream::binary,看了眼微软的实现,ofstream直接继承的ios_base的binary字段,所以两者是等价的。考虑设计者在设计的时候可能会认为继承自ios_base的类会做些修改吧,这里用ofstream::binary更为妥当。
再回到大端小端的问题,如果是要跨平台地按照小端顺序写入文件是怎样呢?因为可能你在小端机器上写入的,在大端机器上读取的就会是错误的数值。
网络编程中处理这个的手段是用htonl和htons库函数,通过隐藏底层细节的转换函数,把多字节整型统一按照网络字节序(大端)来存储。但是有时候仍然需要使用小端来存储,所以还是要会手写转换函数,这里以小端为例。
比如对4字节整型:0x11223344,转换成小端是:0x44 0x33 0x22 0x11。
0x44 = 0x11223344 & 0xFF
0x33 = (0x11223344 & 0xFF00) >> 8
0x22 = (0x11223344 & 0xFF0000) >> 16
0x11 = (0x11223344 & 0xFF000000) >> 24
另外,可以发现0xFF00即0xFF<<8,因此,可以很自然地用一个循环实现这个逻辑。
对于2字节和8字节的整型也是类似,所以可以用一个简单的函数模板来实现。
#include <stdint.h> template <typename T> // T must be integer type
T to_little_endian(T x)
{
size_t n = sizeof(T) / sizeof(uint8_t); // 2,4,8 T res;
uint8_t* p = (uint8_t*) &res; for (size_t i = ; i < n; i++)
{
int offset = * i;
p[i] = (x & (0xFF << offset)) >> offset;
} return res;
}
看似这个实现没什么问题,来写份测试代码看看
uint16_t i1 = 0x1122;
uint32_t i2 = 0x11223344;
uint64_t i3 = 0x1122334455667788;
printf("%04x => %04x\n", i1, to_little_endian(i1));
printf("%08x => %08x\n", i2, to_little_endian(i2));
printf("%016lx => %016lx\n", i3, to_little_endian(i3));
结果如下,8字节整型转换出错
1122 => 1122
11223344 => 11223344
1122334455667788 => 1100000055667788
调试发现原因是0xFF,这个整型字面值的默认类型是int,对于类型uint64_t(unsigned long long),int向左移位会造成溢出。所以需要显式地把0xFF转换为uint64_t类型。对于这个函数模板而言,0xFF << offset表示的是x将低位全部置为0,并舍弃高位,所以结果是不大于x的,那么这里0xFF只用转换成T即可。
修改后的代码:
template <typename T> // T must be integer type
T to_little_endian(T x)
{
size_t n = sizeof(T) / sizeof(uint8_t); // 2,4,8 T res;
uint8_t* p = (uint8_t*) &res;
T mask = static_cast<T>(0xFF); for (size_t i = ; i < n; i++)
{
int offset = * i;
p[i] = (x & (mask << offset)) >> offset;
} return res;
}
至于大端,只需要把int offset = 8 * i改成int offset = 8 * (n - i - 1)即可。
OK,说实话C++的坑真是不少,类型方面的陷阱真不少。刚才用cout打印uint8_t类型的时候也是,必须强制转换成int,因为uint8_t和char都是1字节,所以operator<<模板会将类型识别成char,并用打印字符的方式来打印。
C++将整型数据转换成大端或小端存储顺序的更多相关文章
- 整型,长整型,无符号整型等 大端和小端(Big endian and Little endian)
一.大端和小端的问题 对于整型.长整型.无符号整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节):而 Little endian ...
- C语言--测试电脑存储模式(大端存储OR小端存储)
相信大家都知道大端存储和小端存储的概念,这在平时,我们一般不用考虑,但是,在某些场合,这些概念就显得很重要,比如,在 Socket 通信时,我们的电脑是小端存储模式,可是传送数据或者消息给对方电脑时, ...
- 大端和小端(Big endian and Little endian)
一.大端和小端的问题 对于整型.长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节):而 Little endian 则相反,它 ...
- 大端和小端(big endian little endian)
一.大端和小端的问题 对于整型.长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节):而 Little endian 则相反,它 ...
- 转!大端模式&小端模式
大端模式&小端模式 在C语言中除了8位的char型之外,还有16位的short型,32位的long型(要看具体的编译器),对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器 ...
- 03大端和小端(Big endian and Little endian)
1.大端和小端的问题 对于整型.长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节),而 Little endian 则相反 ...
- Java中如何判断当前环境是大端字节顺序还是小端字节顺序
Java非字节类型的基本类型,除了布尔型都是由组合在一起的几个字节组成的.这些数据类 型及其大小总结在表 2-1 中. 表:基本数据类型及其大小 数据类型 大小(以字节表示) Byte 1 Char ...
- 大端模式&小端模式、主机序&网络序、入栈地址高低问题
一.大端模式&小端模式 所谓的“大端模式”,是指数据的低位(就是权值较小的后面那几位)保存在内存的高地址中,而数据的高位,保存在内存的低地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处 ...
- 判断CPU是大端还是小端模式
在小端模式中,低位字节放在低地址,高位字节放在高地址:在大端模式中,低位字节放在高地址,高位字节放在低地址.big-endian和little-endian,51单片机是典型的大端模式,Intel电脑 ...
随机推荐
- learning uboot auto switch to stanbdy system in qca4531 cpu
design: when uboot load kerne failed,we can switch to stanbdy system; how to realize: when boot fail ...
- ios下 animation-play-state不起作用
这个问题在 做H5音频播放的时候 困扰了好久,PC端一切正常,单单 移动端 出现各种杂乱的问题,也是醉了. 后来经过大量的检索,发现了一种方案很不错: 请看案例 原 创 完全兼容,各个设备,很不 ...
- ant 打 jar 包添加 manifest.mf 文件
经查询 ant 有 <manifest> 任务可以创建 manifest文件(https://ant.apache.org/manual/Tasks/manifest.html) 但尝试在 ...
- AngularJS----ngModelController
文档地址:https://docs.angularjs.org/api/ng/type/ngModel.NgModelController 首先声明:DOM value 与view value是完全不 ...
- Python 其他操作
lst = ["太白","太白","太黑","日天","女神","alex",& ...
- ztree树形菜单的增加删除修改和换图标
首先需要注意一点,如果有研究过树形菜单,就会发现实现删除和修改功能特别简单,但是增加却有一点复杂.造成这个现象是ztree树形菜单的历史遗留问题.大概是之前的版本没有增加这个功能,后来的版本加上了这个 ...
- antd中fomr中resetFields清空输入框
1.如果没有initValue的情况下,直接使用resetFields可以清空文本框的值 2.如果是有initValue的情况下,直接使用resetFields方法会直接重置为initValue的值 ...
- A+B for Input-Output Practice (VIII)
A+B for Input-Output Practice (VIII) Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/3276 ...
- 代理模式及Spring AOP (二)
一.Spring AOP 1.1 Spring AOP 底层还是用的动态代理.如果目标对象所对应的类有接口,spring就用jdk生成代理对象: 如果目标对象所对应的类没有接口,spring就用C ...
- 【转载】Python字符串操作之字符串分割与组合
1. str.split():字符串分割函数 通过指定分隔符对字符串进行切片,并返回分割后的字符串列表. 语法: str.split(s, num)[n] 参数说明: s:表示指定的分隔符,不写的话, ...