C++ UTF8 UrlEncode(宽字符)(转载)
转载:http://www.cnblogs.com/newcj/p/3645749.html
#include "UrlEncode.h"
#include <string>
#include <windows.h>
#include <assert.h> using namespace std; namespace ConnectSDK
{
namespace Utility
{
const wchar_t * hexenc[] = {
L"%00", L"%01", L"%02", L"%03", L"%04", L"%05", L"%06", L"%07",
L"%08", L"%09", L"%0a", L"%0b", L"%0c", L"%0d", L"%0e", L"%0f",
L"%10", L"%11", L"%12", L"%13", L"%14", L"%15", L"%16", L"%17",
L"%18", L"%19", L"%1a", L"%1b", L"%1c", L"%1d", L"%1e", L"%1f",
L"%20", L"%21", L"%22", L"%23", L"%24", L"%25", L"%26", L"%27",
L"%28", L"%29", L"%2a", L"%2b", L"%2c", L"%2d", L"%2e", L"%2f",
L"%30", L"%31", L"%32", L"%33", L"%34", L"%35", L"%36", L"%37",
L"%38", L"%39", L"%3a", L"%3b", L"%3c", L"%3d", L"%3e", L"%3f",
L"%40", L"%41", L"%42", L"%43", L"%44", L"%45", L"%46", L"%47",
L"%48", L"%49", L"%4a", L"%4b", L"%4c", L"%4d", L"%4e", L"%4f",
L"%50", L"%51", L"%52", L"%53", L"%54", L"%55", L"%56", L"%57",
L"%58", L"%59", L"%5a", L"%5b", L"%5c", L"%5d", L"%5e", L"%5f",
L"%60", L"%61", L"%62", L"%63", L"%64", L"%65", L"%66", L"%67",
L"%68", L"%69", L"%6a", L"%6b", L"%6c", L"%6d", L"%6e", L"%6f",
L"%70", L"%71", L"%72", L"%73", L"%74", L"%75", L"%76", L"%77",
L"%78", L"%79", L"%7a", L"%7b", L"%7c", L"%7d", L"%7e", L"%7f",
L"%80", L"%81", L"%82", L"%83", L"%84", L"%85", L"%86", L"%87",
L"%88", L"%89", L"%8a", L"%8b", L"%8c", L"%8d", L"%8e", L"%8f",
L"%90", L"%91", L"%92", L"%93", L"%94", L"%95", L"%96", L"%97",
L"%98", L"%99", L"%9a", L"%9b", L"%9c", L"%9d", L"%9e", L"%9f",
L"%a0", L"%a1", L"%a2", L"%a3", L"%a4", L"%a5", L"%a6", L"%a7",
L"%a8", L"%a9", L"%aa", L"%ab", L"%ac", L"%ad", L"%ae", L"%af",
L"%b0", L"%b1", L"%b2", L"%b3", L"%b4", L"%b5", L"%b6", L"%b7",
L"%b8", L"%b9", L"%ba", L"%bb", L"%bc", L"%bd", L"%be", L"%bf",
L"%c0", L"%c1", L"%c2", L"%c3", L"%c4", L"%c5", L"%c6", L"%c7",
L"%c8", L"%c9", L"%ca", L"%cb", L"%cc", L"%cd", L"%ce", L"%cf",
L"%d0", L"%d1", L"%d2", L"%d3", L"%d4", L"%d5", L"%d6", L"%d7",
L"%d8", L"%d9", L"%da", L"%db", L"%dc", L"%dd", L"%de", L"%df",
L"%e0", L"%e1", L"%e2", L"%e3", L"%e4", L"%e5", L"%e6", L"%e7",
L"%e8", L"%e9", L"%ea", L"%eb", L"%ec", L"%ed", L"%ee", L"%ef",
L"%f0", L"%f1", L"%f2", L"%f3", L"%f4", L"%f5", L"%f6", L"%f7",
L"%f8", L"%f9", L"%fa", L"%fb", L"%fc", L"%fd", L"%fe", L"%ff"
}; String^ UrlEncode(String^ url)
{
wstring text(url->Data()); size_t len = text.length();
std::wstring encoded = L"";
for(size_t i = ; i < len; i++)
{
wchar_t wch = text.at(i);
if ('A' <= wch && wch <= 'Z') {
encoded += wch;
} else if ('a' <= wch && wch <= 'z') {
encoded += wch;
} else if ('' <= wch && wch <= '') {
encoded += wch;
} else if (wch == ' ') {
encoded += hexenc[wch];
} else if (wch == '-' || wch == '_'
|| wch == '.' || wch == '!'
|| wch == '~' || wch == '*'
|| wch == '\'' || wch == '('
|| wch == ')') {
encoded += hexenc[wch];
} else if (wch <= 0x007f) { // other ASCII
encoded += hexenc[wch];
} else if (wch <= 0x07FF) { // non-ASCII <= 0x7FF
encoded += hexenc[0xc0 | (wch >> )];
encoded += hexenc[0x80 | (wch & 0x3F)];
} else { // 0x7FF < ch <= 0xFFFF
encoded += hexenc[0xe0 | (wch >> )];
encoded += hexenc[0x80 | ((wch >> ) & 0x3F)];
encoded += hexenc[0x80 | (wch & 0x3F)];
}
}
return ref new String(encoded.c_str());
} String^ UrlDecode(String^ encodeUrl)
{
wstring text(encodeUrl->Data());
std::wstring decoded = L"";
wchar_t temp[] = L"0x00";
size_t len = text.length();
int sequence = ;
wchar_t conwch = ;
for(size_t i = ; i < len; i++)
{
wchar_t wch = text.at(i++);
if((wch == '%') && (i+ < len))
{
temp[] = text.at(i++);
temp[] = text.at(i);
long tconwch = wcstol(temp, NULL, );
if(tconwch <= 0x7F) {
decoded += tconwch; // normal ascii char
} else if(tconwch >= 0x80 && tconwch <= 0xBF) { // partial byte
tconwch = tconwch & 0x3F;
if(sequence-- == )
tconwch = tconwch << ;
conwch |= tconwch;
if(sequence == )
decoded += conwch;
} else if(tconwch >= 0xC0 && tconwch <= 0xDF) {
conwch = (tconwch & 0x1F) << ; // make space for partial bytes
sequence = ; // 1 more partial bytes follow
} else if(tconwch >= 0xE0 && tconwch <= 0xEF) {
conwch = (tconwch & 0xF) << ; // make space for partial bytes
sequence = ; // 2 more partial bytes follow
} // TODO add case fore 3 partial bytes ... very rare
} else {
decoded += text.at(--i);
}
}
return ref new String(decoded.c_str());
}
}
}
上面是网上找的:
根据项目需要进行修改:
UrlEncode:
CString URLEncode(CString url)
{
std::wstring text = url; size_t len = text.length();
std::wstring encoded = L"";
for(size_t i = ; i < len; i++)
{
wchar_t wch = text.at(i);
if ('A' <= wch && wch <= 'Z') {
encoded += wch;
} else if ('a' <= wch && wch <= 'z') {
encoded += wch;
} else if ('' <= wch && wch <= '') {
encoded += wch;
} else if (wch == ' ') {
encoded += hexenc[wch];
} else if (wch == '-' || wch == '_'
|| wch == '.' || wch == '!'
|| wch == '~' || wch == '*'
|| wch == '\'' || wch == '('
|| wch == ')') {
encoded += hexenc[wch];
} else if (wch <= 0x007f) { // other ASCII
encoded += hexenc[wch];
} else if (wch <= 0x07FF) { // non-ASCII <= 0x7FF
encoded += hexenc[0xc0 | (wch >> )];
encoded += hexenc[0x80 | (wch & 0x3F)];
} else { // 0x7FF < ch <= 0xFFFF
encoded += hexenc[0xe0 | (wch >> )];
encoded += hexenc[0x80 | ((wch >> ) & 0x3F)];
encoded += hexenc[0x80 | (wch & 0x3F)];
}
}
return encoded.c_str();
}
UrlDecode:
CString UrlDecode(CString encodeUrl)
{
std::wstring text = encodeUrl;
std::wstring decoded = L"";
wchar_t temp[] = L"0x00";
size_t len = text.length();
int sequence = ;
wchar_t conwch = ;
for(size_t i = ; i < len; i++)
{
wchar_t wch = text.at(i++);
if((wch == '%') && (i+ < len))
{
temp[] = text.at(i++);
temp[] = text.at(i);
long tconwch = wcstol(temp, NULL, );
if(tconwch <= 0x7F) {
decoded += tconwch; // normal ascii char
} else if(tconwch >= 0x80 && tconwch <= 0xBF) { // partial byte
tconwch = tconwch & 0x3F;
if(sequence-- == )
tconwch = tconwch << ;
conwch |= tconwch;
if(sequence == )
decoded += conwch;
} else if(tconwch >= 0xC0 && tconwch <= 0xDF) {
conwch = (tconwch & 0x1F) << ; // make space for partial bytes
sequence = ; // 1 more partial bytes follow
} else if(tconwch >= 0xE0 && tconwch <= 0xEF) {
conwch = (tconwch & 0xF) << ; // make space for partial bytes
sequence = ; // 2 more partial bytes follow
} // TODO add case fore 3 partial bytes ... very rare
} else {
decoded += text.at(--i);
}
}
return decoded.c_str();
}
C++ UTF8 UrlEncode(宽字符)(转载)的更多相关文章
- GBK转utf-8,宽字符转窄字符
//GBK转UTF8 string CAppString::GBKToUTF8(const string & strGBK) { string strOutUTF8 = "" ...
- 彻底弄懂UTF-8、Unicode、宽字符、locale
目录 Unicode.UCS UTF8 宽字符类型wchar_t locale 为什么需要宽字符类型 多字节字符串和宽字符串相互转换 最近使用到了wchar_t类型,所以准备详细探究下,没想到水还挺深 ...
- C++ UTF8 UrlEncode(宽字符)
为了支持C++ UrlEncode之后的字符串能够被C#所识别(windows phone 下C#只能支持UTF8与 Unicode). 所谓的 UTF8 UrlEncode 也只是宽字符串 UrlE ...
- 宽字符、多字节、unicode、utf-8、gbk编码转化
今天遇到一个编码的问题,困惑了我很长时间,所以就简要的的了解了一下常用的编码类型. 我们最常见的是assic编码,它是一种单字节编码,对多容纳256个字符. 我们在编程的时候经常遇到unicode,u ...
- [转帖]彻底弄懂UTF-8、Unicode、宽字符、locale
彻底弄懂UTF-8.Unicode.宽字符.locale linux后端开发 已关注 彻底弄懂UTF-.Unicode.宽字符.locale unicode 是字符集 utf-8是编码格式.. ...
- SQL注入之Sqli-labs系列第三十二关(基于宽字符逃逸注入)
开始挑战第三十二关(Bypass addslashes) 0x1查看源代码 (1)代码关键点 很明显,代码中利用正则匹配将 [ /,'," ]这些三个符号都过滤掉了 function che ...
- Unicode,GBK,GB2312,UTF-8概念基础(转载)
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础本部分采用重用,转载一篇文章来完成这部分的目标.来源:holen'blog 对字符编码与Unicode,IS ...
- gcc编译器对宽字符的识别
最早是使用VC++工具来学习C++,学的越多就越对VC挡住的我看不见的东西好奇,总想多接触一些开发环境,今日抽空摸索了一下CodeBlocks这个开源的IDE使用方法,配置的编译器是MinGW的gcc ...
- Android NDK 下的宽字符编码转换及icu库的使用(转)
原贴http://topic.csdn.net/u/20101022/16/1b2e0cec-b9d2-42ea-8d9c-4f1bb8320a54.html?r=70149216 ,看过并动手实现, ...
随机推荐
- Easyui主从表设计
js代码: // 全局变量 var loading; var grid; var mainGrid; var dlg_Edit; var dlg_Edit_form; var virpath = &q ...
- notepad++ 行末尾添加指定字符
在查找目标中输入“^”代表行首,“$”代表行末,下方的查找模式要改成“正则表达式”. 如果替换中有字符,则用“\”转义, 例如 : 目标中输入: $ 替换字符输入: \, 则是每行后面加 ...
- Logstash学习1-logstash的简单例子
如何安装ELK Redis插件 1. 安装好logstash后.2. 最简单的logstash.logstash -e 'input { stdin { } } output { stdout {} ...
- Java中的json数据类型操作
package com.ss1.json; import java.util.ArrayList; import java.util.HashMap; import java.util.List; i ...
- 膜拜acm大牛 虽然我不会这题,但是AC还是没有问题的~(转自hzwer)
wywcgs: 亦称Lord Wu,俗名吴垠,2009级厦门大学智能科学与技术学院研究生,本科就读于哈尔滨工业大学.因其深厚的算法功底与独到的思维方式,被尊为“吴教主”,至今声威犹存. 2006年起参 ...
- oracle 日期问题
共三部分: 第一部分:oracle sql日期比较: http://www.cnblogs.com/sopost/archive/2011/12/03/2275078.html 第二部分:Oracle ...
- Mysql密码恢复
由于种种原因,Mysql root用户的密码可能被恶意篡改,这个时候就需要对Mysql进行密码恢复了.大致步骤如下: 1.修改MySQL的登录设置: # vi /etc/my.cnf 在[mysqld ...
- php const define 区别有那些呢?
(1) 编译器处理方式不同 define宏是在预处理阶段展开. const常量是编译运行阶段使用. (2) 类型和安全检查不同 define宏没有类型,不做任何类型检查,仅仅是展开. const常量有 ...
- SQLServer学习笔记<>.基础知识,一些基本命令,单表查询(null top用法,with ties附加属性,over开窗函数),排名函数
Sqlserver基础知识 (1)创建数据库 创建数据库有两种方式,手动创建和编写sql脚本创建,在这里我采用脚本的方式创建一个名称为TSQLFundamentals2008的数据库.脚本如下: ...
- vs 常见问题汇总
vs添加对dll的引用 我们在使用vs进行开发调试的时候经常会遇到一个问题,就是当我们的主工程引用到其他工程更新的dll(我们经常采用copy到工程目录的方法).亦或者当我们的多个工程引用到同一个dl ...