字符串处理 - ANSI - Unicode

#include <stdio.h>

#include <windows.h>

#include <locale.h>

#define BUFF_SIZE 1024 

wchar_t * ANSIToUnicode( const char* str )

{

     int textlen ;

     wchar_t * result;

     textlen = MultiByteToWideChar( CP_ACP, 0, str,-1, NULL,0 );

     result = (wchar_t *)malloc((textlen+1)*sizeof(wchar_t));

     memset(result,0,(textlen+1)*sizeof(wchar_t));

     MultiByteToWideChar(CP_ACP, 0,str,-1,(LPWSTR)result,textlen );

     return result;

} 

char * UnicodeToANSI( const wchar_t* str )

{

     char* result;

     int textlen;

     textlen = WideCharToMultiByte( CP_ACP, 0, str, -1, NULL, 0, NULL, NULL );

     result =(char *)malloc((textlen+1)*sizeof(char));

     memset( result, 0, sizeof(char) * ( textlen + 1 ) );

     WideCharToMultiByte( CP_ACP, 0, str, -1, result, textlen, NULL, NULL );

     return result;

} 

wchar_t * UTF8ToUnicode( const char* str )

{

     int textlen ;

     wchar_t * result;

     textlen = MultiByteToWideChar( CP_UTF8, 0, str,-1, NULL,0 );

     result = (wchar_t *)malloc((textlen+1)*sizeof(wchar_t));

     memset(result,0,(textlen+1)*sizeof(wchar_t));

     MultiByteToWideChar(CP_UTF8, 0,str,-1,(LPWSTR)result,textlen );

     return result;

} 

char * UnicodeToUTF8( const wchar_t* str )

{

     char* result;

     int textlen;

     textlen = WideCharToMultiByte( CP_UTF8, 0, str, -1, NULL, 0, NULL, NULL );

     result =(char *)malloc((textlen+1)*sizeof(char));

     memset(result, 0, sizeof(char) * ( textlen + 1 ) );

     WideCharToMultiByte( CP_UTF8, 0, str, -1, result, textlen, NULL, NULL );

     return result;

}

/*宽字符转换为多字符Unicode - ANSI*/

char* w2m(const wchar_t* wcs)

{

      int len;

      char* buf;

      len =wcstombs(NULL,wcs,0);

      if (len == 0)

          return NULL;

      buf = (char *)malloc(sizeof(char)*(len+1));

      memset(buf, 0, sizeof(char) *(len+1));

      len =wcstombs(buf,wcs,len+1);

      return buf;

}

/*多字符转换为宽字符ANSI - Unicode*/

wchar_t* m2w(const char* mbs)

{

      int len;

      wchar_t* buf;

      len =mbstowcs(NULL,mbs,0);

      if (len == 0)

          return NULL;

      buf = (wchar_t *)malloc(sizeof(wchar_t)*(len+1));

      memset(buf, 0, sizeof(wchar_t) *(len+1));

      len =mbstowcs(buf,mbs,len+1);

      return buf;

} 

char* ANSIToUTF8(const char* str)

{

     return UnicodeToUTF8(ANSIToUnicode(str));

} 

char* UTF8ToANSI(const char* str)

{

     return UnicodeToANSI(UTF8ToUnicode(str));

} 

int main()

{

     /*使用wcstombs和mbstowcs之前必须调用setlocale，以便决定内码*/

     setlocale(LC_ALL,".936");

     /*假定有一个Unicode(UTF-16LE)编码的文件，将其打开，重新编码为ANSI

，写入aa.txt中，再继续编码回Unicode，写入aw.txt中*/

     /*如果不存在a.txt文件，则程序出错，没有做错误处理*/

     char* filename = "a.txt";

     char* filenamea = "aa.txt";

     char* filenamew = "aw.txt";

     FILE*     input=fopen( filename, "rb");

     FILE*     inputa=fopen( filenamea, "wb");

     FILE*     inputw=fopen( filenamew, "wb");

     wchar_t * buf ;

     /*BOE设置，UTF-16LE的BOE为FEFF，如果不先将其读取出来，wcstombs会调用失败*/

     fgetwc(input);

     fputwc(0xFEFF,inputw);

     /*开始读取文件*/

     while(!feof(input))

     {

        buf = (wchar_t *)malloc(sizeof(wchar_t)*BUFF_SIZE)         ;

        memset(buf,    0, sizeof(wchar_t) * BUFF_SIZE );

        fgetws(buf,    BUFF_SIZE,    input);

        fputs(w2m(buf),    inputa);

        fputws(m2w(w2m(buf)),    inputw);

     }

     /*后续处理*/

     fclose(input);

     fclose(inputa);

     fclose(inputw);

     free(buf); 

     return 0;

}

字符串处理 - ANSI - Unicode - UTF8 转换的更多相关文章

各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK)
一直对字符的各种编码方式懵懵懂懂,什么ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们.Let's go! ...
编码占用的字节数 1 byte 8 bit 1 sh 1 bit 中文字符编码 2. 字符与编码在程序中的实现变长编码 Unicode UTF-8 转换在网络上传输保存到磁盘上 bytes
小结: 1.UNICODE 字符集编码的标准有很多种,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等: 2 服务器->网页 utf-8 ...
python 保存文本txt格式之总结篇,ANSI,unicode,UTF-8
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAA4wAAAEmCAIAAACmsIlUAAAgAElEQVR4nOydezxU+f/HP49WSstKkZ
Unicode UTF-8 转换
Unicode是类似“U+4E25”或“\u4E25”的编码方式,很多情况下是4个十六进制的数,有时候不止. Unicode编码系统可分为编码方式和实现方式两个层次: 编码方式:“严”的Unicode ...
[Python] 中文编码问题：raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
最近研究搜索引擎.知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前.虽然市面上讲述中文编码问题的文章数不胜数,同时以前我也讲述过PHP处理数据库服务器中文乱码问题,但是此处还是准备简单做下 ...
趣谈unicode，ansi，utf-8，unicode big endian这些编码有什么区别（转载）
从头讲讲编码的故事.那么就让我们找个草堆坐下,先抽口烟,看看夜晚天空上的银河,然后想一想要从哪里开始讲起.嗯,也许这样开始比较好…… 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同 ...
【转】【编码】ANSI,ASCII,Unicode,UTF8之一
不同的国家和地区制定了不同的标准,由此产生了 GB2312.GBK.GB18030.Big5.Shift_JIS 等各自的编码标准.这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称 ...
[转]unicode，ansi，utf-8，unicode big endian的故事
unicode,ansi,utf-8,unicode big endian的故事很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的 ...
趣谈unicode，ansi，utf-8，unicode big endian这些编码有什么区别
从头讲讲编码的故事.那么就让我们找个草堆坐下,先抽口烟,看看夜晚天空上的银河,然后想一想要从哪里开始讲起.嗯,也许这样开始比较好…… 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同 ...

随机推荐

无聊看看c是咋写游戏的
/* 项目名称:五子棋, vs */ /* 绘图环境,初始化游戏 1.绘图环境(窗口) 2.背景图片 3.背景音乐 4.绘制棋盘 */ #include"pch.h" #inclu ...
Day7 - J - Raising Modulo Numbers POJ - 1995
People are different. Some secretly read magazines full of interesting girls' pictures, others creat ...
C语言中语句的跨行支持总结
C语言中语句的跨行支持总结: 预处理一行写不下: 把一个预处理指示写成多行要用""续行,因为根据定义,一条预处理指示只能由一个逻辑代码行组成. 正常程序一行写不下: 把C代码写成多 ...
吴裕雄--天生自然java开发常用类库学习笔记：国际化程序
import java.util.ResourceBundle ; public class InterDemo01{ public static void main(String args[]){ ...
SDRAM调试总结
SDRAM的调试总结 1 说明实验平台: JZ2440 CPU: S3C2440 SDRAM型号: EM63A165TS-6G 2 SDRAM的一些基本概念 2.1 引脚分配 2.2 引脚描 ...
（八）微信小程序---获取定位信息chooseLocation
微信小程序---获取定位信息 chooseLocation wxml <view bindtap="getlocalPath">{{localPath}}</v ...
从0开始自己配置一个vps虚拟服务器(1)
我前几年买的虚拟机都被我荒废了,我已经配置过很多遍了,但是从来没有真的用过.因为我前几个月之前又新买了一个便宜的服务,准备写新的东西.供应商pacificrack,真的很烂,一直断,控制面板还打不开, ...
UVA - 11354 Bond（最小生成树+LCA+瓶颈路）
题意:N个点,M条路,每条路的危险度为路上各段中最大的危险度.多组询问,点s到点t的所有路径中最小的危险度. 分析: 1.首先建个最小生成树,则s到t的路径一定是危险度最小的. 原因:建最小生成树的最 ...
微信小程序调用用百度地图天气功能
#小程序之调用百度地图天气功能本篇博客主要介绍小程序在百度地图中获取天气信息,如有不全请指出.下面先上效果图主要内容百度地图API的个人密钥,也就是AK 请求百度地图API接口数据获取到的信息 ...
云时代架构阅读笔记一——Java性能优化（一）
Java语言学习了这么长时间之后,自己对于Java编程的一些细节还是稍微有点总结,正好根据云时代架构中<Java高级开发必会的50个性能优化的细节(珍藏版)>来叙述一些我和里面的点比较相符 ...

字符串处理 - ANSI - Unicode - UTF8 转换

字符串处理 - ANSI - Unicode - UTF8 转换的更多相关文章

随机推荐

热门专题