windows下多字节和宽字节转换】的更多相关文章

先简单说下什么是多字节和宽字节. 多字节是指使用多个字节(1-3)表示一个字符.比如gbk使用英文占一个字节,中文占2个,这个就是多字节了.utf-8是使用1-3个字节表示字符.还有big5等等. 宽字节一般是固定使用2个字节表示一个字符,utf-16(一般就是指unicode). 1.MultiByteToWideChar 多字节转宽字节 2.WideCharToMultiByte 宽字节转多字节 3.和utf8有关的字符转换,代码页CodePage=CP_UTF8. 4.代码页CodePag…
以前看<Window核心编程>,感觉多字节和宽字节之间还比较麻烦的,至少MultiByteToWideChar函数和WideCharToMultiByte函数有足够多的参数的意义让我们去理解.近日接触了ATL的一个很好的字符串的转换宏:A2W和W2A. 用法很简单,A2W的用法: [cpp] view plaincopy #include <atlconv.h> DoSomething(LPWSTR str);  //  函数声明 USES_CONVERSION; DoSometh…
所谓的短字符,就是用8bit来表示的字符,典型的应用是ASCII码. 而宽字符,顾名思义,就是用16bit表示的字符,典型的有UNICODE. ********************************第一个就是宽字符到多字节字符转换函数,函数原型如下: int WideCharToMultiByte( UINT CodePage, DWORD dwFlags, LPCWSTR lpWideCharStr, int cchWideChar, LPSTR lpMultiByteStr, in…
在windows下设置字节对齐大小的方式,目前我了解有三种: 1. 在编译程序时候的编译选项  /Zp[n],如 cl /Zp4 表示对齐大小是4字节: 2. 预处理命令   #pragma pack( [ show ] | [ push | pop ] [, identifier ] , n  ): 3. 微软特定命令  __declspec(align(#)). 下面我将分别介绍这三种,并分析不同方式的优缺点,先明确下字节对齐大小都是2的指数倍如1,2,4,8,16,32等. 方法一的用法最…
author:fanfq(xiaoban) Email:fangqing.fan#gmail.comlink:http://fanfq.iteye.com/admin/blogs/655569changelog:有很多朋友发邮件问我关于ffmpeg视频转码的相关问题,我也尝试了帮助他们去解决这些问题,由于个人精力有限就blog上总结一下大家所遇到的一些问题.以下代码只要是使用的我的包是肯定没有问题的,但是至限于*->flv,因为不同格式的视频转码所对应的参数也是不一样的,想要达到效果教好的视频的…
C/C++中的字节转换 宽字节转单字节 :size_t wcstombs( char *mbstr, const wchar_t *wcstr, size_t count ); 单字节转宽字节 :size_t mbstowcs( wchar_t *wcstr, const char *mbstr, size_t count ); 上面这两个是标准C++的,下面两个好像是微软的函数.不过上面两个函数只能一个一个的转换,也就是说一次只能转换一个字符.下面两个方法就是 宽字符串与单字节字符串之间的转换…
Windows 下字节转换 #include <string> #include <windows.h> class CharsConversion { public: static bool MultiByte2UTF8( const std::string&, std::string& ); static bool UTF82MultiByte( const std::string&, std::string& ); static bool Mu…
2012-03-25 14:54 (分类:计算机程序) 2.2 宽字符和C 宽字符不一定是Unicode.Unicode是宽字符集的一种.然而,因为本书的焦点是Windows而不是C执行的理论,所以书中把宽字符和Unicode作为同义语. 2.2.1 char数据类型 (1)下面的语句定义并初始化了一个只包含一个字符的变量: char c = 'A' ; 变量c需要1个字节来保存,并将用十六进位数0x41初始化,这是字母A的ASCII代码. (2)可以这样定义一个指向字串的指针: char *…
由于在windows下的QT编程中,如果涉及到使用微软的API,那么不可避免使用_TCHAR这些类型,因此在网上查了一下,其中一个老外的论坛有人给出了这个转换,因此在这里做一下笔记 : )#ifdef UNICODE #define QStringToTCHAR(x)     (wchar_t*) x.utf16() #define PQStringToTCHAR(x)    (wchar_t*) x->utf16() #define TCHARToQString(x)     QString:…
最近做一个项目需要将微信的语音文件放在页面进行播放,查了好多资料发现,web页面直接播放并没有一个好的解决方案,于是就想到了先将amr文件转换成易于在页面播放的mp3文件,然后在进行播放,现在将amr文件转化为mp3文件的几种方式以及踩过的坑分享一下: 查了好多资料,总结一下,amr转换mp3的方式有如下几种: 1.通过jave.jar包实现(不可以转微信及qq语音文件): 我用的是:jave-1.0.2.zip jave.jar包官方下载 2.通过ffmpeg.exe实现(不可以转微信及qq语…
github上有两个package做编码转换,都是基于iconv,用到了cgo,在linux下没有问题,在windows下用,非常麻烦.采用mingw安装libiconv也不行,一直提示找不到libiconv方法. 最终找到一个官方实现(纯go实现):https://code.google.com/p/go/source/checkout?repo=text gbk转utf-8示例: func gbk2utf8(str byte[]) ([]byte, error) { return iouti…
当我们使用MinGW-w64作为编译器在windows系统环境下进行C语言编程时,如果源代码文件(.c)保存格式为Ansi格式,则在打印汉字时不会出现乱码:反之,如果我们使用UTF-8格式保存,则会出现乱码,需要在编译时加上"-fexec-charset=gbk"来解决乱码问题. #include <stdio.h> int main() { printf("%s\n", "你好,世界!"); return 0; } 那么,当我们使用…
mysql5.6版本配置文件有两个 1.默认的配置在program files/MySQL/MySQL Server 5.6/my-default.ini 2.一个在programData/MySQL/MySQL Server 5.6/my.ini 注意需要配置第二个的my.ini添加 [mysqld] lower_case_table_names=2 重启MySQL即可 引文: windows 和linux对大小写的敏感性不同而导致的.数据库和表名在 Windows 中是大小写不敏感的 ,而在…
0x01 背景 首先我们了解下宽字节注入,宽字节注入源于程序员设置MySQL连接时错误配置为:set character_set_client=gbk,这样配置会引发编码转换从而导致的注入漏洞.具体原理如下:1.正常情况下当GPC开启或使用addslashes函数过滤GET或POST提交的参数时,黑客使用的单引号 ‘ 就会被转义为: \’:2.但如果存在宽字节注入,我们输入%df%27时首先经过上面提到的单引号转义变成了%df%5c%27(%5c是反斜杠\),之后在数据库查询前由于使用了GBK多…
缓冲区溢出是什么? 当缓冲区边界限制不严格时,由于变量传入畸形数据或程序运行错误,导致缓冲区被“撑爆”,从而覆盖了相邻内存区域的数据 成功修改内存数据,可造成进程劫持,执行恶意代码,获取服务器控制权等后果 POP3   PASS 命令存在缓冲区溢出漏洞   无需身份验证实现远程代码执行 软件 slmail          http://slmail.software.informer.com/5.5/ mona.py      https://github.com/corelan/mona i…
说道wchar_t和char两个类型大家都不会陌生 wchar_t:在windows下是Unicode 16编码,也就是俗称宽字节 char:当然就是指一个字节,在windows下面默认是gbk编码的 所以在windows 下 wchar_t 转 char也就是编码转化 直接贴出wchar_t *字符串和char *字符串的集中互转方法 方法一:利用Windows的宏W2A,A2W USES_CONVERSION; char* test1 = W2A(L"我是宽字节");//转化成默认…
最近老猿在学习文件操作及网络爬虫相关知识,发现字符集及编码的处理非常重要,而老猿原来对此了解并不多,因此找了几篇文章看了一下,将老猿认为比较的相关文章转载一下.感谢各位原创大神! 1,字符集 这里主要讲两种字符集,DBCS和UCS DBCS即双字节编码字符集,最初的计算机只有ASCII码,发展至今,不能表示中文怎么办,于是中国人制定了GBK2312,以及后面陆续扩展并向下兼容的GBK,GB18030. Unicode学名是"Universal Multiple-Octet Coded Chasr…
3.5.2动态链接库的创建 3.5.2.1动态链接库的创建流程 动态链接库的创建流程如下图所示: 在系统设计阶段,主要的设计内容包括:类结构的设计以及功能类之间的关系,动态链接库的接口.在动态链接库中,包含两类函数:一类是内部函数,一类是外部函数.内部函数只能在动态链接库的内部使用,不能被动态链接库以外的模块调用:外部函数是该动态链接库的接口,可以被外部模块调用. 为了使外部函数能够被系统外的模块调用,在进行C++代码编写的时候,必须对外部函数执行导出.导出的级别有两种:函数级别的导出和类级别的…
本文是对C++应用程序在Windows下的编译.链接的深入理解和分析,文章的目录如下: 我们先看第一章概述部分. 1概述 1.1编译工具简介 cl.exe是windows平台下的编译器,link.exe是Windows平台下的链接器,C++源代码在使用它们编译.链接后,生成的可执行文件能够在windows操作系统下运行.cl.exe和link.exe集成在Visual Studio中,随着开发工具Visual Studio的安装,它们也被安装到与VC相关的目录下. 使用该编译器的方式有两种,一种…
4动态链接 4.1概述 在静态链接阶段,链接器为PE文件生成了导入表,导出表,符号表,并调整了Call指令后面的操作数,在程序调用的时候,能够直接地或者间接地定位到IAT中的某个位置,在PE文件中,该位置包含符号的名称,当PE文件加载到内存以后,该位置应该修正为符号的地址.这些已有的信息和已经完成的工作是后续动态链接的基础. 动态链接的任务是:在程序的加载或者运行阶段,执行各个模块的基址重定位工作,并将IAT中的符号名称修正为动态链接库中被调用的符号的地址. 动态链接分为隐式动态链接和显式动态链…
说明 为何要写这篇文章 ,之前看过阿二的梦想船的<Poco::TCPServer框架解析> http://www.cppblog.com/richbirdandy/archive/2010/09/10/123994.html 无奈代码太多,看起繁琐.所以 准备 以流程图简化,便于理解.也方便自己以后使用. 本文内容 是基于window api分析的. 本文的poco是1.4.6p4 (2014-04-18)版本的. 虽然现在poco版本是1.6 但调用改动不大. poco下载地址:http:/…
首先:不要使用 mysql_escape_string(),它已被弃用,请使用 mysql_real_escape_string() 代替它. mysql_real_escape_string() 和 addslashes() 的区别在于: 区别一: addslashes() 不知道任何有关MySQL连接的字符集.如果你给所使用的MySQL连接传递一个包含字节编码之外的其他编码的字符串,它会很愉快地把所有值为字符'.".\和\x00的字节进行转义.如果你正在使用不同于8位和UTF-8的其它字符,…
1.简介 所谓“底层数据包”指的是在“运行”于数据链路层的数据包,简单的说就是“以太网帧”,而我们常用的Socket只能发送“运行”在传输层的TCP.UDP等包,这些传输层数据包已经能满足绝大部分需求,但是有些时候还是需要发送底层数据包的(例如SYN扫描),那么如何发送呢? 本文记录了我试图实现的过程中遇到的一些问题以及解决办法,需要注明:①本文只考虑Windows上的实现  ②本文主要目的是实现发送部分  ③本文假定读者理解网络分层结构和一些基本的网络编程方法  ④本文只是在讨论常规技术,切勿…
服务器端代码server.cpp: #include <stdio.h> #include <WinSock2.h> #pragma comment(lib,"ws2_32.lib") //加载ws2_32.dll int main() { //初始化DLL /************************************************************************/ /*调用WSAStartup()函数进行初始化,并指明要…
windows下编程获取磁盘(分区)使用情况 windows下编程获取磁盘(分区)使用情况 GetLogicalDriveStrings函数 使用示例 获取需要的缓冲区长度示例 获取所有驱动器号示例 GetDriveType函数 使用示例 GetDiskFreeSpaceEx 函数 使用示例 linux下可以使用命令df -h来获取各个(已加载)分区的使用情况.Windows下也有很多好的工具来获取,但是我没有发现windows下的df命令. 在linux下使用df -h命令的输出如下 o@Ne…
一.Linux下的ping参数 用途 发送一个回送信号请求给网络主机. 语法 ping [ -d] [ -D ] [ -n ] [ -q ] [ -r] [ -v] [ \ -R ] [ -a addr_family ] [ -c Count ] [ -w timeout ] [ -f | -i \ Wait ] [ -l Preload ] [ -p Pattern ] [ -s PacketSize ] [ -S hostname/IP addr ] \ [ -L ] [ - I a.b.c…
windows 下实现函数打桩:拦截API方式            近期由于工作须要,開始研究函数打桩的方法. 由于不想对project做过多的改动,于是放弃了使用Google gmock的想法. 可是也足足困扰另外我一天一宿. 经过奋战,最终有所收获.闲话少说,開始看看有什么方法. 一.基础准备 1. 函数调用的原理:通过函数名(函数的入口地址)对函数进行訪问,如果我们可以改变函数首地址指向的内存的话,使其跳转到还有一个函数去运行的话,那么就行实现函数打桩了. 2. 方法:对函数首地址出写入…
Windows下的进程和Linux下的进程是不一样的,它比较懒惰,从来不执行任何东西,它只是为线程提供执行环境,然后由线程负责执行包含在进程的地址空间中的代码.当创建一个进程的时候,操作系统会自动创建这个进程的第一个线程,成为主线程.线程由两部分组成:一是线程的内核对象.操作系统用它来对线程实施管理,内核对象也是系统用来存放线程统计信息的地方.二是线程栈.线程栈用于维护线程在执行代码时所需的所有函数参数和局部变量.线程可以访问所在进程的内核对象的所有句柄.所有内存和这个进程中的其他线程的堆栈.…
接前一篇C++ ABI之名字改编(以Qt为例),继续看看C++名字改编相关的问题. 问题 MSVC 有一对选项/Zc:wchar_t- 与 /Zc:wchar_t控制wchar_t 于是 wchar_t 可以是 unsigned short 或 __wchar_t(称为原生类型?) 的别名 两个东西混用会怎么样? 首先考虑,会混用么?,是杞人忧天么? 由于 Qt 为 MSVC 提供的二进制包采用的前者/Zc:wchar_t-.考虑: 如果你编译自己的Qt程序时,启用了后者,会怎么样? 如果Qt程…
Linux下将UTF8编码批量转换成GB2312编码的方法 在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误,这时就需要将UTF8编码转换成GB2312编码,下面为大家介绍下在Linux下如何进行转换   UTF8编码和GB2312编码是有区别的,在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误,这时就需要将UTF8编码转换 成GB2312编码,可是一个个的转换十分麻烦,下面小编就教你如何在Linux下将UTF8编码批量转换成GB2312编码. 背景 本人在使用ora…