RFC3986编码 C 语言实现(支持大部分中文)
前些时间做 xauth 认证程序的编写,网上找到RFC3986编码不支持中文的编码,所以便查找了一些资料.自己写了一个,代码如下.
#include <stdlib.h>
#include <string.h>
#include <stdio.h>
#include <android/log.h>
#include "RFC3986Encoder.h" bool isReverseChar(char c);
char* charToHexString(char c);
bool isChinese(char c); //#define snprintf _snprintf
/**
* Escape 'string' according to RFC3986 and
* http://oauth.net/core/1.0/#encoding_parameters.
*
* @param string The data to be encoded
* @return encoded string otherwise NULL
* The caller must free the returned string.
*/ static void *xmalloc_fatal(size_t size) {
if (size==) return NULL;
fprintf(stderr, "Out of memory.");
exit();
} void *xrealloc (void *ptr, size_t size) {
void *p = realloc (ptr, size);
if (p == NULL) return xmalloc_fatal(size);
return p;
} void *xmalloc (size_t size) {
void *ptr = malloc (size);
if (ptr == NULL) return xmalloc_fatal(size);
return ptr;
} char *xstrdup (const char *s) {
void *ptr = xmalloc(strlen(s)+);
strcpy((char *)ptr, s);
return (char*)ptr;
} char *oauth_url_escape(const char *string) {
size_t alloc, newlen;
char *ns = NULL, *testing_ptr = NULL;
unsigned char in;
size_t strindex=;
size_t length; if (!string) return xstrdup(""); alloc = strlen(string)+;
newlen = alloc; ns = (char*) xmalloc(alloc); length = alloc-;
while(length--) {
in = *string; switch(in){
case '': case '': case '': case '': case '':
case '': case '': case '': case '': case '':
case 'a': case 'b': case 'c': case 'd': case 'e':
case 'f': case 'g': case 'h': case 'i': case 'j':
case 'k': case 'l': case 'm': case 'n': case 'o':
case 'p': case 'q': case 'r': case 's': case 't':
case 'u': case 'v': case 'w': case 'x': case 'y': case 'z':
case 'A': case 'B': case 'C': case 'D': case 'E':
case 'F': case 'G': case 'H': case 'I': case 'J':
case 'K': case 'L': case 'M': case 'N': case 'O':
case 'P': case 'Q': case 'R': case 'S': case 'T':
case 'U': case 'V': case 'W': case 'X': case 'Y': case 'Z':
case '_': case '~': case '.': case '-':
ns[strindex++]=in;
break;
default:
newlen += ; /* this'll become a %XX */
if(newlen > alloc) {
alloc *= ;
testing_ptr = (char*) xrealloc(ns, alloc);
ns = testing_ptr;
} //转换成16进制. 58-->3A
//%3A 这是3个.这里好像是自动 加 '/0' 如果生成的的字符串,大于4则不会,自动加/0
//在linux 下,这个方法,的count 包括 '/0'所以最后的结果也是正确的. int result = snprintf(&ns[strindex], , "%%%02X", in); /*
printf("%d\n",result); printf("%d\n",in); printf("strlen(buf) = %d\n",strlen(ns));
printf("%s\n",ns);
*/ strindex+=;
break;
}
string++;
}
ns[strindex]=;
return ns;
} #ifndef ISXDIGIT
# define ISXDIGIT(x) (isxdigit((int) ((unsigned char)x)))
#endif //自己写的代码 3
char* rfc3986Encoder(const char* input)
{
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder start %s\n", input); if (!input) return xstrdup(""); //char* sb = (char*)malloc(1024);
char* sb = new char[];
sb[]= '\0';
int length = strlen(input);
for (int i = ; i<length; i++)
{
char c = input[i];
if(isReverseChar(c)){
const char* temp;
if(isChinese(c))
{
//这里认为汉字 utf-8为三字节,首位为连续三个1,取unicode的后8位
//这里相于 utf-8 到 unicode 的转换,只是转换了后8位.
int high = (input[i+]&0x03)<<;
int low = input[i+]&0x3f;
char chinese = (high+low)&0xff;
temp = charToHexString(chinese);
i+=;
}else{
temp = charToHexString(c);
}
strcat(sb,temp);
}
else{
int len = strlen(sb);
const char* p = &c; //字符看不到结束符,所以会错.
strcat(sb,p);
sb[len+] = '\0';
}
}
//__android_log_print(ANDROID_LOG_INFO, "Test_jni","encoder end %s\n", sb);
return sb;
} bool isReverseChar(char c)
{
return !((c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') || (c >= '' && c <= '')
|| c == '-' || c == '_' || c == '.' || c == '~');
} char* charToHexString(char src){
int v = src & 0xFF;
char* hv = new char[];
snprintf(hv, ,"%%%02X",v);
return hv ;
}
bool isChinese(char c)
{
int x = c&0xE0;
if(x == )
return true;
else
return false;
}
如程序中体现的,oauth_url_escape() 这个方法不支持对中文的编码 ,所以我便另外写了个方法 rfc3986Encoder().如程序中所说,我这里认为UTF8 汉字为 3 byte ,所以已经包含了大部分的汉字.具体的参考资料当时没做笔记,大该就是关于 UTF8 汉字编码的问题.程序思想,也比较好懂.研读java 的RFC3986编码实现,发现其获取utf8汉字的编码实际为unicode 编码的后8位.所以我这里把 utf8 向 unicode 编码的转化,只取了后8位,再转换成 hex 的形式.代码我做了部分测试,目前还没有发现什么问题.
RFC3986编码 C 语言实现(支持大部分中文)的更多相关文章
- GJM :用JIRA管理你的项目(二)JIRA语言包支持及插件支持 [转载]
感谢您的阅读.喜欢的.有用的就请大哥大嫂们高抬贵手"推荐一下"吧!你的精神支持是博主强大的写作动力以及转载收藏动力.欢迎转载! 版权声明:本文原创发表于 [请点击连接前往] ,未经 ...
- Cassandra在CQL语言层面支持多种数据类型
Cassandra在CQL语言层面支持多种数据类型. CQL类型 对应Java类型 描述 ascii String ascii字符串 bigint long 64位整数 blob ByteBuffer ...
- Ruby 对多语言的支持
这是一篇翻译文章,原文链接 http://blog.grayproductions.net/articles/understanding_m17n.原文是一个系列,翻译过来整合成了一篇文章,对文章内容 ...
- 用JIRA管理你的项目——(二)JIRA语言包支持及插件支持
昨天兴奋地把JIRA环境搭好,瞅了一眼管理界面--全英文,真是汗! 尚且不说全中文版管理界面让人操作起来多少会有困难,更别说是全英文! 昨天赞叹JIRA语言包支持丰富,今天终于找到了号称100%的语言 ...
- 系统区域设置 本地语言的支持依赖于 /etc/locale.conf,/etc/locale.conf 包含不少于此相关的环境变量
https://linux.cn/lfs/LFS-BOOK-7.7-systemd/chapter07/locale.html 7.7. 系统区域设置 本地语言的支持依赖于 /etc/locale.c ...
- Windows server 2012 添加中文语言包(英文转为中文)(离线)
Windows server 2012 添加中文语言包(英文转为中文)(离线) 相关资料: 公司环境:亚马孙aws虚拟机 英文版Windows2012 中文SQL Server2012安装包,需要安装 ...
- 现有语言不支持XXX方法
史上最强大的IDE也会有bug的时候哈,今天遇到这个问题特别郁闷,百度了下,果然也有人遇到过这个问题 解决方法: 1.调用的时候参数和接口声明的参数不一致(检查修改) 2.继承接口中残留一个废弃的方法 ...
- ueditor的工具栏显示乱码解决方法 小问题.. 是你的页面编码与语言包js编码不符所导致的
ueditor的工具栏显示乱码解决方法 小问题.. 是你的页面编码与语言包js编码不符所导致的解决方法:用记事本将ueditor\..\lang\zh-cn\zh-cn.js打开,然后保存为ANSI ...
- Java SE 6 新特性: 对脚本语言的支持
2006 年底,Sun 公司发布了 Java Standard Edition 6(Java SE 6)的最终正式版,代号 Mustang(野马).跟 Tiger(Java SE 5)相比,Musta ...
随机推荐
- public,protected,private辨析
一直没有很清楚理解这三个修饰权限的区别,今天终于搞明白了,现总结如下: private:最严格的一个,子类无法继承,只有本类内部内访问,在其余类及子类中通过 "类名.方法" 去调用 ...
- JSON.parse()和JSON.stringify()的区别
1. parse用于从一个字符串中解析出json对象,如 var str = '{"name":"huangxiaojian","age": ...
- MATLAB 图像处理——Contrast Enhancement Techniques
Contrast Enhancement Techniques %调整图片尺寸imresizeimages{k} = imresize(images{k},[width*dim(1)/dim(2) w ...
- 《Java中的不可变类》
//不可变类举例: /* 下面程序试图定义一个不可变类Person类,但=因为Person类包含一个引用类型的成员变量, 且这个引用类是可变类,所以导致Person类也变成了可变类. */ class ...
- Ubuntu中添加eclipse
环境:Ubuntu 14.04 步骤: 1.安装配置JDK,详见 http://my.oschina.net/u/1407116/blog/227084 2.下载eclipse 从官网http://w ...
- 黑马程序员——【Java基础】——Java IO流
---------- android培训.java培训.期待与您交流! ---------- 一.IO概述 1.IO:是Input.Output的缩写. 2.特点: (1)用于处理设备间的数据传输. ...
- windows核心编程---第六章 线程的调度
每个线程都有一个CONTEXT结构,保存在线程内核对象中.大约每隔20ms windows就会查看所有当前存在的线程内核对象.并在可调度的线程内核对象中选择一个,将其保存在CONTEXT结构的值载入c ...
- asp.net与asp.net 优缺点
Asp.net Mvc架构模式是一种 低耦合.可测试的web应用程序框架,它是基于CLR和成熟的MVC架构构建的.ASP.NET MVC不支持ViewState和服务器控件. Asp.net优点: 1 ...
- windows7共享硬盘 虚拟机Mac访问windows7硬盘
选择本地磁盘(G)-->右键-->共享-->高级共享点击高级共享 确定 完成共享 虚拟机Mac 访问共享磁盘 2.苹果MAC系统,点击桌面.打开顶部菜单 “前往”. 3.菜单 ...
- [转]使用 C 编写 Lua 模块
Lua 作为一种小巧的语言,一般都是嵌入到 C/C++ 中作为扩展语言,但是也可以作为独立的脚本语言使用,并且可以使用 C/C++ 编写扩展模块.在参考资料 [1] 中有怎样用 C/C++ 编写模块的 ...