码表 Unicode GBK UTF8 示例
Unicode的编码形式与对应的字符串相互转换
/*** Unicode的编码形式与对应的字符串相互转换* @author 白乾涛*/public class UnicodeUtils {public static void main(String[] args) throws UnsupportedEncodingException {test1();test2();//服务器返回的很可能是这种形式的字符串String unicodeMessages = "{\"code\":200,\"message\":\"\\u4fdd\\u5b58\\u6210\\u529f\"}";//所有的引号和反斜杠前面都要加一个反斜杠System.out.println(unicodeToString(unicodeMessages) + "\n");//{"code":200,"message":"保存成功"}}private static void test1() {System.out.println("【汉】的Unicode编码为【" + toUnicodeString('汉') + "】");//【汉】的Unicode编码为【\u6c49】System.out.println("【\\u6c49】对应的字符为【" + unicodeToString("\u6c49") + "】");//【\u6c49】对应的字符为【汉】System.out.println("\u6c49");//会自动解码【汉】System.out.println(0x9FFF - 0x3000 + "\n");//【28671】}private static void test2() {String string = "aA1:中国";String unicode = toUnicodeString(string);System.out.println("【" + string + "】的Unicode编码为【" + unicode + "】");//【\u0061\u0041\u0031\u003a\u4e2d\u56fd】System.out.println(unicodeToString(unicode));//【aA1:中国】for (int i = 0; i < unicode.length(); i += 6) {System.out.print(unicode.substring(i, i + 6));//并不会解码,只是把Unicode编码形式的字符串打印出来,为什么呢?}System.out.println("\n" + unicode);//同样,这里也不会解码。【\u0061\u0041\u0031\u003a\u4e2d\u56fd】}/*** 将【字符】转换成Unicode码形式【Unicode用两个字节来编码一个字符,2^16=16^4,所以可以用四个16进制数表示】*/public static String toUnicodeString(char c) {StringBuilder sb = new StringBuilder("");String hexString = Integer.toHexString(c);sb.append("\\u");//用于标识这是一个Unicode码for (int j = hexString.length(); j < 4; j++) {sb.append(0);//不足四位用0填充}sb.append(hexString);return sb.toString();}/*** 将【字符串】转换成Unicode码形式*/public static String toUnicodeString(String string) {StringBuilder sb = new StringBuilder("");for (int i = 0; i < string.length(); i++) {sb.append(toUnicodeString(string.charAt(i)));}return sb.toString();}/*** 将Unicode编码解析成字符串形式*/public static String unicodeToString(String uString) {StringBuilder sb = new StringBuilder();int i = -1, pos = 0;while ((i = uString.indexOf("\\u", pos)) != -1) {sb.append(uString.substring(pos, i));if (i + 5 < uString.length()) {pos = i + 6;sb.append((char) Integer.parseInt(uString.substring(i + 2, i + 6), 16));}}sb.append(uString.substring(pos));return sb.toString();}}
字符串编码格式转换
}
码表 Unicode GBK UTF8 示例的更多相关文章
- 字符编码-UNICODE,GBK,UTF-8区别【转转】
字符编码介绍及不同编码区别 今天看到这篇关于字符编码的文章,抑制不住喜悦(总结的好详细)所以转到这里来.转自:祥龙之子http://www.cnblogs.com/cy163/archive/2007 ...
- unicode gbk utf-8的差异
GB2312(1980年)定义,包含6763个汉字,682个字符 GBK1.0 定义了21003个汉字,21886个字符 ASCII->GB2312->GBK 编码方式向后兼容,即同一个字 ...
- 码表 ASCII Unicode GBK UTF-8
2017-1-3 [ASCII]一个字节(7位,128个字符,2个16进制) 不包含中文 ASCII(American Standard Code for Information Interchang ...
- UNICODE,GBK,UTF-8区别
简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与g ...
- 【JAVA编码专题】UNICODE,GBK,UTF-8区别
简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与g ...
- 【JAVA编码专题】UNICODE,GBK,UTF-8区别 分类: B1_JAVA 2015-02-10 21:07 153人阅读 评论(0) 收藏
简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与g ...
- Python UNICODE GBK UTF-8 之间相互转换
Python 编码格式检测,可以使用 chardet , 例如: import urllib rawdata = urllib.urlopen('http://www.google.cn/').rea ...
- C# unicode GBK UTF-8和汉字互转
界面: 源码: using System; using System.Collections.Generic; using System.ComponentModel; using System.Da ...
- UTF-8,Unicode,GBK,希腊字母读法,ASCII码表,HTTP错误码,URL编码表,HTML特殊字符,汉字编码简明对照表
UNICODE,GBK,UTF-8区别 UNICODE,GBK,UTF-8区别 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那 ...
随机推荐
- 带圆角的EditText
转载请注明出处:http://blog.csdn.net/krislight/article 1.定义一个Drawable <?xml version="1.0" encod ...
- 【HDOJ】4553 约会安排
线段树.线段树的细节很重要,小数据遍历可以发现问题. /* 4553 */ #include <iostream> #include <string> #include < ...
- perl静态编译DBD
编译DBD 项目中经常使用perl,但perl在连接数据库时,需要依赖DBI,DBD驱动,但默认安装DBD驱动时,需要依赖数据库的lib库. 比如perl连接MySQL,需要安装MySQL clien ...
- .NET开发不可错过的25款高效工具
这些年来,微软的 .NET 开发团队不断在更新升级开发工具,这也提供了一个机会,让我们能对 .NET 系列的开发工具做出不断的评估和规范.以下是我们总结出的一些 .NET 开发不可错过的高效工具. 1 ...
- jQuery选择器上下文
- Linux 文件权限总结
在 Linux 中最基本的任务之一就是设置文件权限.理解它们是如何实现的是你进入 Linux 世界的第一步.如您所料,这一基本操作在类 UNIX 操作系统中大同小异.实际上,Linux 文件权限系统就 ...
- JSON AND BSON
JSON JavaScript Object Notation (JSON) is an open, human and machine-readable standard that facilita ...
- Android之ContextMenu的使用方法以及与OptionMenu的区别
>> ContextMenu是android的context menu上下文菜单,选择某项VIEW后长按menu键,就会显示出来.比如EditeText就可以通过长按来弹出拥有“cut”, ...
- fiddler 抓包post请求body参数在jmeter中的书写
jmeter请求一直报错,最后查出来是请求参数的格式写错了,醉了 记录一下,以防我再次健忘 fidder抓包显示详情 jmeter 请求body data参数书写直接复制fiddler里TextVie ...
- 《Effective C++》学习笔记条款13 以对象管理资源
条款 13 :以对象管理资源 例: voidf() { Investment *pInv = createInvestment(); ... ...