Python2处理字符集问题

这篇文章主要介绍了Python2.x中文乱码问题解决方法,本文解释问题原因、给出了处理办法并讲解了编码解码的一些知识,需要的朋友可以参考下

　　Python中乱码问题是一个很头痛的问题。

　　在Python3中，对中文进行了全面的支持，但在Python2.x中需要进行相关的设置才能使用中文。否则会出现乱码

　　【问题原因】

　　在Python2.x中主要是字符编码的问题，处理不好的话，会导致乱码。Python默认采取的ASCII编码，字母、标点和其他字符只使用一个字节来表示，但对于中文字符来说，一个字节满足不了需求。

　　代码如下:

　　>>> import sys

　　>>> sys.getdefaultencoding()

　　'ascii'

　　为了能在计算机中表示所有的中文字符，中文编码采用两个字节表示。如果中文编码和ASCII混合使用的话，就会导致解码错误，从而才生乱码。而CMD下默认的编码方式为:GBK，所以就造成了上面的乱码!

社区环卫，我们更专业！

专业生产销售各种型号的电动洒水车咨询电话：18810885758

　　采用两个字节的中文编码标准有：GB2312、GBK、BIG5等。

　　【处理办法】

　　为了将各种不同的语言包含在统一的字符集中，满足国际间的信息交流，国际上制订了UNICODE字符集，包含了世界上所有语言字符，这些字符具有唯一的编码，通过使用UNICODE字符集可以满足跨语言的文字处理，避免乱码的产生。

　　i) 交互式命令中：一般不会出现乱码，无需做处理

　　ii) py脚本文件中：跨字符集必须做设置，否则乱码。

　　首先在开头一句添加:

　　代码如下:

　　# coding = utf-8

　　# 或

　　# coding = UTF-8

　　# 或

　　# -*- coding: utf-8 -*-

　　其次需将文件保存为UTF-8的格式!

　　上面那一句仅仅是告诉Python编译器:脚本中包含了非ASCII字符，并未进行转换。

　　如果要将字符编码从默认的ASCII改为UTF-8，需要在保存的时候选择保存为UTF-8格式。

　　如果是用NODEPAD打开，【另存为】-->UTF-8即可

千锋ios培训0学费入学

千锋ios培训做真实的自己用良心做教育. 千锋ios培训学费不降价品质不打折.

　　如果是用IDLE打开，【Options】-> 【Configure IDLE】->【General】

千锋ios培训0学费入学

千锋ios培训做真实的自己用良心做教育. 千锋ios培训学费不降价品质不打折.

　　上面的设置，可以保证IDLE，运行F5，能正常输出中文。

　　【编码解码】

　　在开头添加了# -*- coding: utf-8 -*-并将文件保存为UTF-8格式，仍然不能保证能输出正常输出中文，

　　不同的编辑器，如VIM，IDLE，Eclipse使用的输出编码都是不一致的。

　　所以，在一个地方能正常输出中文，在另外一个地方就未必。所以还必须做编码解码设置!

　　encode:编码

　　decode:解码

　　必须保证编码、解码的对象是同一个。比如说UTF-8方式编码，必须再用UTF-8进行解码即可。

　　所以最终解决办法，还必须先按原先的方式解码，再按控制台格式重新编码:比如CMD默认是GBK方式

　　则必须使用如下方式:

　　正确输出结果:

　　【其他说明】

　　1.在Python3中，对中文的支持非常全面，源文件默认保存为UTF-8的编码，这样一来，不但可以在源代码中使用中文，而且变量名也可以使用中文，比如说:

　　代码如下:

　　>>> 中国 = 'Chinese'

　　>>> print(中国)

　　Chinese

　　2.在Python3中，不需要来回的编解码，并且字符串对象也没有decode和encode方法。

来源： http://www.3lian.com/edu/2015/06-03/218858.html

null

Python2处理字符集问题的更多相关文章

python学习笔记--python简介
一.什么是python? python是一种面向对象.解释型的高级程序语言.python具有语法简洁.易于学习.功能强大,可扩展性强,跨平台等诸多特点.1989年开始开发,于1991年发布第一个公开发 ...
Python基础之二
字符编码: 二进制记录:128 64 32 16 8 4 2 1 1 1 1 1 1 1 1 1 = 8位 ascii 编码:占1个字节8位,只能表示256个符号,主要用于显示英语和其 ...
python字符集选择
# coding=utf8 或者 # -*- coding:utf-8 -*- 在python2 中默认是ASCII码的字符集,但可以引入其他的字符集这个需要在头信息中引入: 而在python3中 ...
[python]Python2编码问题
以下内容说的都是 python 2.x 版本简介基本概念 Python "帮"你做的事情推荐姿势基本概念我们看到的输入输出都是'字符'(characters),计算机(程 ...
Python2和Python3的一些语法区别
Python2和Python3的一些语法区别 python 1.print 在版本2的使用方法是: print 'this is version 2 也可以是 print('this is versi ...
字符、字符集、编码，以及它们python中会遇到的一些问题（下）
在看了很多的博客文章之后,总结整理得到了以下文章,非常感谢这些无私奉献的博主! 文章末尾有本文引用的文章的链接,如果有漏掉的文章引用,可以发邮件联系我,随后再次附上链接! 侵删!!! 这一部分是下篇, ...
不想再被鄙视？那就看进来！一文搞懂Python2字符编码
程序员都自视清高,觉得自己是创造者,经常鄙视不太懂技术的产品或者QA.可悲的是,程序员之间也相互鄙视,程序员的鄙视链流传甚广,作为一个Python程序员,自然最关心的是下面这幅图啦我们项目组一值使用 ...
Python2.x的编码问题
1. 计算机编码历史 ASCII Python的默认编码,其是一种单字节的编码.刚开始计算机世界里只有英文,而单字节可以表示256个不同的字符.最开始ASCII只定义了128个字符编码,包括96个文字 ...
Python2 编码问题分析
本文浅显易懂,绿色纯天然,手工制作,请放心阅读. 编码问题是一个很大很杂的话题,要向彻底的讲明白可以写一本书了.导致乱码的原因很多,系统平台.编程语言.多国语言.软件程序支持.用户选择等都可能导致无法 ...

随机推荐

Adobe Flash Builder 4.6 Premium 安装破解
1.到Adobe官网下载FlashBuilder 4.6,有简体中文版: 语言:简体中文(Simplified)http://trials3.adobe.com/AdobeProducts/FLBR/ ...
Netty系列之一开始使用
Netty是用来做什么的呢,我的理解是它是一个网络开发框架,利用它能很快速方便的开发出高性能的服务端和客户端.刚开始学习java的时候你一定接触过怎么利用socket去实现服务端和客户端,后来java ...
CSS格式化工具
一直想自己写个css格式化工具,因为原先的<CSS代码格式化和压缩化>工具,压缩or格式化的都不是我的编码习惯.我的格式化工具也许代码方面细节方面都没他的好,但是符合自身需要的东西才是好东 ...
WPF 同一窗口内的多线程 UI（VisualTarget）
WPF 的 UI 逻辑只在同一个线程中,这是学习 WPF 开发中大家几乎都会学习到的经验.如果希望做不同线程的 UI,大家也会想到使用另一个窗口来实现,让每个窗口拥有自己的 UI 线程.然而,就不能让 ...
如何实现一个可以用 await 异步等待的 Awaiter
.NET 和 C# 共同给我们带来的 async/await 异步编程模型(TAP)用起来真的很爽.为了实现异步等待,我们只需要在一切能够能够异步等待的方法前面加上 await 即可.能够异步等待的最 ...
用eclipse运行java程序显示找不到main class，网上的方法都试了，还是不行，有没有知道怎么解决的呀！
编译器问题,jdk版本不对,Window --> Preferences -->Java --> compiler中的compiler compliance level,这里选你当前 ...
iis 部署未在本地计算机上注册“Microsoft.Jet.OleDb.4.0”提供程序
C#读取Access数据库在VS调试时正常,发布到win7-64的IIS之后报错“未在本地计算机上注册“Microsoft.Jet.OleDb.4.0”提供程序”.原因是VS调试时模拟的是32位,发布 ...
RabbitMQ概念
RabbitMQ 即一个消息队列,_主要是用来实现应用程序的异步和解耦,同时也能起到消息缓冲,消息分发的作用._RabbitMQ使用的是AMQP协议,它是一种二进制协议.默认启动端口 5672. 在 ...
jsp转向，exception
jsp要像servlet那样转向时可以得 <jsp:forward page="Counter.jsp"> <jsp:param name="parma ...
requireJS多页面应用实例
本文是requireJS的一些知识点的总结,配上多页面应用中的实例分析. 本案例的目录结构如下: requireJS API的三个主要函数:define(创建模块),require(加载模块),con ...

Python2处理字符集问题

Python2处理字符集问题的更多相关文章

随机推荐

热门专题