今天在工作中遇到这样一个问题（工作环境为Python2.7.1），需要将一个字典中字符串形态的Unicode类型的汉字转换成中文，随便总结一下：

1、unicode转中文

old = u'\u4e2d\u56fd'

print old.encode(encoding='utf-8')

>>>>> 中国

2、str形态的unicode转中文

old = '\\u9690\\u79c1\\u7a83\\u53d6'

print old.encode('utf-8').decode('unicode_escape')

>>>>> 隐私窃取

3、认识python2和python3编码并对比

Python有两种不同的字符串，一种存储文本，一种存储字节。对于文本，python内部采用Unicode存储，而字节字符串显示原始字节序列或者ASCII。

什么叫编码（encode）？

将Unicode字符按照编码规则（如UTF-8）编成字节序列

什么叫解码（decode）?

将字节序列按照编码规则（如UTF-8）解释成unicode形式

Python2 中字符的类型：

	1、str： 已经编码后的字节序列

	2、unicode： 编码前的文本字符

import platform

print (platform.python_version())

str = '中国'

print(str,type(str))

print (str.decode('utf-8'),type(str.decode('utf-8')))

2.7.13

('\xe4\xb8\xad\xe5\x9b\xbd', <type 'str'>)

(u'\u4e2d\u56fd', <type 'unicode'>)

Python3 中字符的类型：

	1、str： 编码过的 unicode 文本字符

	2、bytes： 编码前的字节序列

import platform

print (platform.python_version())

str = '中国'

print(str,type(str))

print (str.encode('utf-8'),type(str.encode('utf-8')))

3.2.0

中国 <class 'str'>

b'\xe4\xb8\xad\xe5\x9b\xbd' <class 'bytes'>

在Python3中的 str 对象在Python2中叫做 unicode ，感觉很通俗对吧？但 bytes 对象在Python2中叫做 str ，总体来说，在 Python3 中，字符编码问题得到了极大的优化，不再像 Python2 那么头疼。在 Python3 中，文本总是 Unicode, 由 str 类型进行表示，二进制数据使用 bytes 进行表示，不会将 str 与 bytes 偷偷的混在一起，使得两者的区别更加明显。

unicode转中文以及str形态的unicode转中文的更多相关文章

js 中文汉字转Unicode、Unicode转中文汉字、ASCII转换Unicode、Unicode转换ASCII、中文转换&#XXX函数代码
最近看不少在线工具里面都有一些编码转换的代码,很多情况下我们都用得到,这里脚本之家小编就跟大家分享一下这些资料 Unicode介绍 Unicode(统一码.万国码.单一码)是一种在计算机上使用的字符编 ...
Python - TypeError: unicode argument expected, got 'str'
参考:TypeError: unicode argument expected, got 'str' Python代码: from io import StringIO def main(): f = ...
利用RNN进行中文文本分类（数据集是复旦中文语料）
利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 1.训练词向量数据预处理参考利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) ,现在我们有了分词 ...
SSH Secure Shell Client连接Linux 命令行显示中文乱码问题和oracle 查询数据中文乱码问题
一.SSH Secure Shell Client连接Linux 命令行显示中文乱码问题 linux 设置系统语言修改 /etc/sysconfig/i18n 文件,如 LANG="en_ ...
mysql 控制台环境下查询中文数据乱码，插入、更新中文数据不成功
mysql 控制台环境下查询中文数据乱码,插入.更新中文数据不成功登录mysql密码是加入编码参数--default-character-set,中文用gbk mysql -uroo ...
jQuery Cookie (内附上百行的中文使用手册,与所有的注释中文翻译)
jQuery Cookie (内附上百行的中文使用手册,与所有的注释中文翻译) 博主亲自翻译. 大家多多捧场. 更多资源请点击"查看TA 的资源" .全场通通 2积分. htt ...
利用CNN进行中文文本分类（数据集是复旦中文语料）
利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 利用RNN进行中文文本分类(数据集是复旦中文语料) 上一节我们利用了RNN(GRU)对中文文本进行了分类,本节我们将继续使用 ...
Unicode字符集下CString与char *转换（解决中文乱码等）（转）
UniCode 下 CString 转 char* 的方法的文章有很多,但是大部分都是在互相转载,看了那么多资料,仍然没有解决乱码的问题,后来从一个论坛的一条回复里面找到了正确的方法,特此拿出来与大家 ...
Python+Webdriver,中文前加u是unicode格式编码的意思
Python+Webdriver写脚本时,对一些输入框赋值会涉及到输入中文,这时需要在中文前加u 举个例子,在用百度搜索时,要在搜索输入框内输入值, 我用的编码格式是utf-8,向输入框内输入值是:d ...

随机推荐

Spring 集成Junit单元测试
1.在pom增加junit和spring-test <dependency> <groupId>junit</groupId> <artifactId> ...
mysql主从复制--重置操作reset master, reset slave
本文介绍reset master, reset slave的作用. reset master 在master上执行 mysql > RESET MASTER 作用包括: 删除binlog索引文件 ...
zabbix 监控报警详细邮件内容
AlarmHost:{HOSTNAME1} AlarmTime:{EVENT.DATE} {EVENT.TIME} AlarmLevel:{TRIGGER.SEVERITY} AlarmMessige ...
Python实例讲解 -- wxpython 基本的控件（按钮）
使用按钮工作在wxPython 中有很多不同类型的按钮.这一节,我们将讨论文本按钮.位图按钮.开关按钮(toggle buttons )和通用(generic )按钮. 如何生成一个按钮? 在第一部 ...
关于JFame 屏幕居中显示的问题
场景: 在利用 JAVA 的 Swing 开发 C/S 架构的前端界面目的: 想让 JFrame 居中显示在整个屏幕的正中位置方法一:JFrame frame = new JFr ...
LeetCode——7. Reverse Integer
一.题目链接:https://leetcode.com/problems/reverse-integer/ 二.题目大意: 给定一个整数,要求反转该整数之后再返回:如果归返回的整数超过了int型整数的 ...
C++进阶--隐式类型转换
//############################################################################ /* 隐式类型转换 * * 类型转换可分为 ...
[ZZ]Appium 文档翻译
http://testerhome.com/topics/150 Appium 是一个开源的,适用于原生或混合移动应用应用( hybrid mobile apps )的自动化测试平台. Appium ...
PAT 乙级 1008 数组元素循环右移问题 (20) C++版
1008. 数组元素循环右移问题 (20) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 一个数组A中存有N(N>0)个整数,在不允 ...
使用StringEscapeUtils对Java中特殊字符进行转义和反转义
https://blog.csdn.net/zdx1515888659/article/details/84966214 Java中转义字符反斜杠 \ 的代替方法 | repalceAll 内涵解析 ...

unicode转中文以及str形态的unicode转中文

1、unicode转中文

2、str形态的unicode转中文

3、认识python2和python3编码并对比

unicode转中文以及str形态的unicode转中文的更多相关文章

随机推荐

热门专题