PHP解码unicode编码中文字符代码示例

在抓取某网站数据，结果在数据包中发现了一串编码的数据："......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据，想解码出中文来。
解决方案：
方案A(稳定版+推荐)：

function replace_unicode_escape_sequence($match) {

return mb_convert_encoding(pack('H*', $match[1]), 'UTF-8', 'UCS-2BE');

}

$name = '\u65b0\u6d6a\u5fae\u535a';

$str = preg_replace_callback('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', $name);

echo $str; //输出： 新浪微博

// www.jbxue.com 脚本学堂

//咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)

class Helper_Tool

{

static function unicodeDecode($data)

{

function replace_unicode_escape_sequence($match) {

return mb_convert_encoding(pack('H*', $match[1]), 'UTF-8', 'UCS-2BE');

} 

$rs = preg_replace_callback('/\\\\u([0-9a-f]{4})/i', 'replace_unicode_escape_sequence', $data);

return $rs;

}

}

//调用

$name = '\u65b0\u6d6a\u5fae\u535a';

$data = Helper_Tool::unicodeDecode($name); //输出新浪微博

方案B(次推荐)：

<?php

function unicodeDecode($name){

$json = '{"str":"'.$name.'"}';

$arr = json_decode($json,true);

if(empty($arr)) return '';

return $arr['str'];

} // www.jbxue.com

$name = '\u65b0\u6d6a\u5fae\u535a';

echo unicodeDecode($name); //输出： 新浪微博

对于方案B，注意事项，在好友 XAR (猛戳XAR博客) 的技术支持下，总结出要处理的字符串（即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号，否则就会导致解析失败, 所以有必要的话可以借助 str_replace()函数将非法字符格式化为合格字符）

PHP解码unicode编码中文字符代码示例的更多相关文章

PHP解码unicode编码中文字符代码
function replace_unicode_escape_sequence($match) { return mb_convert_encoding(pack('H*', $match[1]), ...
PHP解码unicode编码的中文字符
问题背景:晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......www.jinyuanbao.cn" ...
unicode编码、字符的转换和得到汉字的区位码
一:unicode编码.字符的转换截图二:unicode编码.字符的转换代码 using System; using System.Collections.Generic; using System ...
【转】javascript和html中unicode编码和字符转义的详解
不是十分理解unicode和html转义的情况下,可能会误用,所以下面会对它们再做比较容易理解的解释: 1.html中的转义:在html中如果遇到转义字符(如“ ”),不管你的页面字符编码是utf-8 ...
javascript和html中unicode编码和字符转义的详解
1.html中的转义:在html中如果遇到转义字符(如“ ”),不管你的页面字符编码是utf-8亦或者是GB2312,都会直接打印成相应的字符:而当遇到(如:“\u8981”[此处的8981是16进制 ...
c# unicode 编码中文转换已测试（转）
中文传参时因为编码不同经常凌乱风中,故传前编成unicode码来过度是一个不错的解决方法 /// <summary> /// 中文转unicode /// </summ ...
三种常见的编码：ASCII码、UTF-8编码、Unicode编码等字符占领的字节数
ASCII码: 一个英文字母(不分大写和小写)占一个字节的空间.一个中文汉字占两个字节的空间. 一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制. 最小值0,最大值25 ...
json_encode不编码中文字符的方式
json_encode($array,JSON_UNESCAPED_UNICODE);
【转】python 字符编码与解码——unicode、str和中文：UnicodeDecodeError: 'ascii' codec can't decode
原文网址:http://blog.csdn.net/trochiluses/article/details/16825269 摘要:在进行python脚本的编写时,如果我们用python来处理网页数据 ...

随机推荐

Post和get乱码
post 在web.xml中添加 <filter> <filter-name>CharacterEncodingFilter</filter-name> <f ...
Vue.js相关知识2-组件
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...
JAVA条件语句
1.if if (判断条件) { 条件成立时执行的代码 } 2.if..else if (判断条件) { 条件成立时执行的代码 } else { 条件不成立时执行的代码 } 3.多重if if (条件 ...
开源app之MyHearts
前言这个月,说实话,有忙有闲,经历了一次病痛的洗礼,才认识到了只有好好的生活,认真的对待自己的身体,才能更好的去工作,没有了身体的支撑,什么工作都只能是纸老虎,不攻自破.在这里也祝愿大家,在生活中好 ...
Rational Rose 安装及破解方法
Rational Rose 的安装与破解: 所需材料: 1.“Rational rose 2003.rar”安装包压缩文件 2.“license.rar”压缩文件(一 ...
linux服务之varnish
https://www.varnish-cache.org/installation/redhatvarnish是现在很流行的一个HTTP(80)缓存加速解决方案,varnish是基于内存的缓存加速. ...
将m个苹果放入n个盘子的问题【转】
来自:http://blog.csdn.net/qq675927952/article/details/6312255 问题1: m----->相同, n---> 相同,可为空将m个苹果 ...
Ackerman函数
Ackerman函数在许多讲解递归的书中都提到,但似乎又对解题没有太大的意义,暂时不知道了.不过这个东西,是一个数学知识点,暂时收藏于此吧. 查了一下维基百科和百度百科,表面上两个定义不一样,仔细推敲 ...
OpenJudge计算概论-球弹跳高度的计算
/*======================================================================== 球弹跳高度的计算总时间限制: 1000ms 内存 ...
wikioi 1203 判断浮点数是否相等
/*======================================================================== 1203 判断浮点数是否相等题目描述 Descr ...

PHP解码unicode编码中文字符代码示例

PHP解码unicode编码中文字符代码示例的更多相关文章

随机推荐

热门专题