c++字符编码转换
c++字符编码转换
简述
字符编码一直是软件开发中很麻烦的问题。当前项目开发普遍使用的字符集是utf-8
,而windows系统则默认是gbk
,linux默认编码则是utf-8
,所以想要开发一个在windows正常运行的软件,就需要考虑字符集的问题。
c++11新增了很多本地化的功能,包括字符编码转换等,主要使用wstring_convert和codecvt相结合进行转换,下面介绍具体的方法供大家学习(复制粘贴 )。
windows:gbk编码,std::wstring = std::u16string,wchar_t = char16_t (utf-16编码)
linux:utf-8编码,std::wstring = std::u32string,wchar_t = char32_t (utf-32编码)
编码转换
依赖的头文件:
#include <codecvt>
#include <locale>
转换方法:
coding.h
#ifndef TE_TEST_CODING_H
#define TE_TEST_CODING_H #include <string> namespace coding { #ifdef _WIN32
//GBK locale name in windows
inline constexpr const char * GBK_LOCALE_NAME = ".936";
#else
inline constexpr const char * GBK_LOCALE_NAME = "zh_CN.GBK";
#endif /**
* utf-8 --> wchar
* @param _utf8 要求std::string的编码是utf-8
* @return 宽字符串
*/
std::wstring utf8_to_wstr(const std::string& _utf8); /**
* wchar --> utf-8
* @param _wstr 宽字符串
* @return 转化为utf-8 编码的字符串
*/
std::string wstr_to_utf8(const std::wstring& _wstr); /**
* utf-8 --> gbk
* @param _utf8 utf-8
* @return gbk
*/
std::string utf8_to_gbk(const std::string& _utf8); /**
* gbk --> utf-8
* @param _gbk gbk
* @return utf-8
*/
std::string gbk_to_utf8(const std::string& _gbk); /**
* gbk --> std::wstring
* @param _gbk gbk
* @return 宽字符串
*/
std::wstring gbk_to_wstr(const std::string& _gbk); /**
* std::wstring --> gbk
* @param _wstr 宽字符串
* @return gbk
*/
std::string wstr_to_gbk(const std::wstring& _wstr);
} #endif //TE_TEST_CODING_H
coding.cpp
#include "coding.h" #include <codecvt>
#include <locale> // 包装 wstring/wbuffer_convert 所用的绑定本地环境平面的工具
template<class Facet>
struct deletable_facet : Facet
{
template<class ...Args>
explicit deletable_facet(Args&& ...args) : Facet(std::forward<Args>(args)...) {}
~deletable_facet() override = default;
}; std::wstring coding::utf8_to_wstr(const std::string &_utf8) {
std::wstring_convert<std::codecvt_utf8<wchar_t>> converter;
return converter.from_bytes(_utf8);
} std::string coding::wstr_to_utf8(const std::wstring &_wstr) {
std::wstring_convert<std::codecvt_utf8<wchar_t>> convert;
return convert.to_bytes(_wstr);
} std::string coding::utf8_to_gbk(const std::string &_utf8) {
std::wstring tmp_wstr = utf8_to_wstr(_utf8);
return wstr_to_gbk(tmp_wstr);
} std::string coding::gbk_to_utf8(const std::string &_gbk) {
std::wstring tmp_wstr = gbk_to_wstr(_gbk);
return wstr_to_utf8(tmp_wstr);
} std::wstring coding::gbk_to_wstr(const std::string &_gbk) {
using codecvt = deletable_facet<std::codecvt_byname<wchar_t, char, mbstate_t>>;
std::wstring_convert<codecvt> convert(new codecvt(GBK_LOCALE_NAME));
return convert.from_bytes(_gbk);
} std::string coding::wstr_to_gbk(const std::wstring& _wstr) {
using codecvt = deletable_facet<std::codecvt_byname<wchar_t, char, mbstate_t>>;
std::wstring_convert<codecvt> convert(new codecvt(GBK_LOCALE_NAME));
return convert.to_bytes(_wstr);
}
补充说明
结构体deletable_facet
的作用是公有化codecvt_byname
模板类的析构函数,该类的析构函数默认为 protected。部分编译环境实现允许析构析构方法为保护的对象,但部分(如GUN)要求自定义类,继承 Facet 并有 public 的析构方法,否则会出现以下问题:
In file included from /usr/include/c++/6.2.1/bits/locale_conv.h:41:0,
from /usr/include/c++/6.2.1/locale:43,
from main.cpp:3: /usr/include/c++/6.2.1/bits/unique_ptr.h: In instantiation of ‘void std::default_delete<_Tp>::operator()(_Tp*) const [with _Tp = std::codecvt<wchar_t, char, __mbstate_t>]’:
/usr/include/c++/6.2.1/bits/unique_ptr.h:236:17: required from ‘std::unique_ptr<_Tp, _Dp>::~unique_ptr() [with _Tp = std::codecvt<wchar_t, char, __mbstate_t>; _Dp = std::default_delete<std::codecvt<wchar_t, char, __mbstate_t> >]’
/usr/include/c++/6.2.1/bits/locale_conv.h:218:7: required from here
/usr/include/c++/6.2.1/bits/unique_ptr.h:76:2: error: ‘virtual std::codecvt<wchar_t, char, __mbstate_t>::~codecvt()’ is protected within this context
delete __ptr;
^~~~~~
In file included from /usr/include/c++/6.2.1/codecvt:41:0,
from main.cpp:1:
/usr/include/c++/6.2.1/bits/codecvt.h:426:7: note: declared protected here
~codecvt();
^
本文参考了博客并在其基础上进行补充完善,修复了部分问题。
c++字符编码转换的更多相关文章
- iconv字符编码转换
转自 http://blog.csdn.net/langresser_king/article/details/7459367 iconv(http://www.gnu.org/software/li ...
- Char Tools,方便的字符编码转换小工具
工作关系,常有字符编码转换方面的需要,写了这个小工具 Char Tools是一款方便的字符编码转换小工具,基于.Net Framework 2.0 Winform开发 主要功能 URL编码:URLEn ...
- php 字符编码转换函数 iconv mb_convert_encoding比较
在使用PHP处理字符串时,我们经常会碰到字符编码转换的问题,你碰到过iconv转换失败吗? 发现问题时,网上搜了搜,才发现iconv原来有bug ,碰到一些生僻字就会无法转换,当然了配置第二个参数时, ...
- 编码问题 php字符编码转换类
各种平台和软件打开显示的编码问题,需要使用不同的编码,根据我们不同的需求. php 字符编码转换类,支持ANSI.Unicode.Unicode big endian.UTF-8.UTF-8+Bom ...
- Python—字符编码转换、函数基本操作
字符编码转换 函数 #声明文件编码,格式如下: #-*- coding:utf-8 -*- 注意此处只是声明了文件编码格式,python的默认编码还是unicode 字符编码转换: import sy ...
- php字符编码转换之gb2312转为utf8(转)
在php中字符编码转换我们一般会用到iconv与mb_convert_encoding进行操作,但是mb_convert_encoding在转换性能上比iconv要差很多哦.string iconv ...
- day4学python 字符编码转换+元组概念
字符编码转换+元组概念 字符编码转换 #coding:gbk //此处必声明 文件编码(看右下角编码格式) #用来得到python默认编码 import sys print(sys.getdefaul ...
- erlang中字符编码转换(转)
转自:http://www.thinksaas.cn/group/topic/244329/ 功能说明: erlang中对各种语言的编码支持不足,此代码是使用erlang驱动了著名的iconv编码库来 ...
- Qt代码区字符编码转换
在做通讯练习的时候,发现发送给小助手字符乱码,图片如下 本人Qt Creator是UTF-8,需要改成gbk,代码如下 #include<QTextCodec> // 提供字符编码转换 Q ...
- C++ 字符编码转换类
记录一下C++ 编码转换的函数: #pragma once #include "afx.h" #define DEFAULT_CODE 0 #define CHINESE_SIMP ...
随机推荐
- mobaXterm 查看密码
参考:MobaXterm中密码的查看方式 检查是否把密码保存到了注册表中 然后从https://github.com/HyperSine/how-does-MobaXterm-encrypt-pass ...
- FSCTF 2023(公开赛道)WP
FSCTF 2023 ID:Mar10 Rank:6 总结:下次看到不正常报错一定重新安装一遍工具~~ web 源码!启动! 就在源码注释里 <!-- 师傅们,欢迎来到CTF的世界~ NSSCT ...
- Mybatis 插入后获取主键
项目结构 数据表结构 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmln ...
- Vue 数组和对象更新,但视图未更新,背后的故事
在实际开发中,遇到遍历数组和对象,当property 发生改变时,并没有触发视图的更新今天来浅显的聊聊这背后的故事,有说的不对地方,还望指出! 本人博文地址:https://www.cnblogs.c ...
- TIER 2: Oopsie
TIER 2: Oopsie Web 渗透 此次靶机结合前面知识,非常简单: nmap 扫描,发现 22 和 80 端口开放 服务 80 的 HTTP 服务 之后使用继续 Web 渗透: 使用 Wap ...
- VUE小知识~作用域插槽
作用域插槽可以为我们向组件内插入特定的标签,方便修改维护. 组件内需要使用 <slot></slot>进行插槽站位. 组件标签内需要使用<template > &l ...
- 关键点检测(1)——标注关键点检测数据(labelme和CVAT)
关键点检测,作为计算机视觉领域的重要分支,广泛应用于人体姿态估计.面部表情识别.手部动作分析等多个场景.其核心在于从图像中准确检测并定位特定的关键点位置.然而,高效的模型训练离不开大量高质量的标注数据 ...
- 单细胞测序最好的教程(十):细胞类型注释迁移|万能的Transformer
作者按 本章节主要讲解了基于transformer的迁移注释方法TOSICA,该算法在迁移注释上达到了SOTA的水平,在注释这么卷的赛道愣是杀出了一条血路.本教程首发于单细胞最好的中文教程,未经授权许 ...
- [python] 启发式算法库scikit-opt使用指北
scikit-opt是一个封装了多种启发式算法的Python代码库,可以用于解决优化问题.scikit-opt官方仓库见:scikit-opt,scikit-opt官网文档见:scikit-opt-d ...
- 【GeoScene】一、创建、发布路网服务,并在代码中测试最短路径分析
前言 网上关于GeoScene及GeoScene API for JavaScript的资料太少了,官方的技术支持又太慢了,最近把在项目中踩过的坑分享出来: **版本信息** GeoScene Pro ...