今天在做一个新浪微博的抓取测试,发现抓取后的内容是Unicode编码的,完全找不到熟悉的汉字了,下面搜索出来的一种方法,完全可行,只是不知到Java内部是否提供了相关的类库. 实现方法如下: public static String fromEncodedUnicode(char[] in, int off, int len) { char aChar; char[] out = new char[len]; int outLen = 0; int end = off + len; while…
编码含义 关于编码的含义,之前也说过,计算机只能存储二进制序列 所以对于字符,保存的时候,需要进行编码为二进制,进行存储 呈现的时候,需要将二进制进行解码,转换成字符的形式 有很多种编码方式,比如ASCII (American Standard Code for Information Interchange,美国信息交换标准代码) 使用一个字节进行编码,一个字节可以表示的最大值为255 很显然,对于英语和其他一些西欧语言来说,足够了,英文字母总共才几个对吧 那么对于汉字呢?ASCII显…