07 Python编码问题
17) 编码
18) Python3的执行过程
19) 常见编码错误原因
20) 后附一部分编码详细信息(个人总结,有误望指正)
想了解Python3的编码更细致的讲解请参考大王的文章
http://www.cnblogs.com/alex3714/articles/7550940.html
17,编码
Python2默认的文件编码是,ASCII
所以默认是不支持中文,若想支持中文,要在文件顶行写上
#! -*- coding: utf-8 -*-
#! encoding: utf-8
Python3默认的文件编码是,UTF-8
Windows中文版默认编码是,GBK
Linux / Mac OS默认编码是,UTF-8
18,Python3 的执行过程
1,解释器找到代码文件,把代码字符串按文件头定义的编码加载到内存,转成Unicode
(可以把源文件看成一个很长的字符串)
2,把代码字符串按照语法规则进行语法分析
3,所有的变量字符都会以Unicode编码声明
Note:
Python3的源文件的默认文件编码是UTF-8
Python3解释器的默认编码是Unicode
Python2的源文件的默认文件编码是ASCII
Python2解释器的默认编码是ASCII
在Python3中如果不使用默认编码,记得一定要在文件头声明;在PyCharm改没用
python3中:默认文件编码为UTF-8
加载到内存后成了Unicode
(其实不管声明文件编码为什么,到内存中都会转成Unicode,仅限Python3)
在Windows终端下执行,正常显示
虽然Windows CMD的编码是GBK,
但是Unicode的作用其中之一是有跟全球所有国家语言编码的映射关系
python2中:默认文件编码为ascii
加载到内存后还是ascii,
就算你声明了编码是utf-8,到内存后依然是utf-8,
(声明什么,内存中就是什么) 所以,
在Windows终端下执行,显示不正常
因为Windows CMD的编码是GBK,
GBK处理不了utf-8的编码
只有两种途径才能正常显示:
1,文件头声明编码为gbk
2,字符串显示地转成Unicode
19,常见编码错误的原因:
Python解释器的默认编码
Python源文件的文件编码
Terminal使用的编码
操作系统的语言设置







07 Python编码问题的更多相关文章
- 【转】Python——编码规范
来自于 啄木鸟社区 Python Coding Rule --- hoxide 初译 dreamingk 校对发布 040724 --- xyb 重新排版 040915 --- ZoomQuiet M ...
- (转载) 浅谈python编码处理
最近业务中需要用 Python 写一些脚本.尽管脚本的交互只是命令行 + 日志输出,但是为了让界面友好些,我还是决定用中文输出日志信息. 很快,我就遇到了异常: UnicodeEncodeError: ...
- Python 编码简单说
先说说什么是编码. 编码(encoding)就是把一个字符映射到计算机底层使用的二进制码.编码方案(encoding scheme)规定了字符串是如何编码的. python编码,其实就是对python ...
- Python之路3【知识点】白话Python编码和文件操作
Python文件头部模板 先说个小知识点:如何在创建文件的时候自动添加文件的头部信息! 通过:file--settings 每次都通过file--setings打开设置页面太麻烦了!可以通过:View ...
- python编码规范
python编码规范 文件及目录规范 文件保存为 utf-8 格式. 程序首行必须为编码声明:# -*- coding:utf-8 -*- 文件名全部小写. 代码风格 空格 设置用空格符替换TAB符. ...
- 【转】python编码的问题
摘要: 为了在源代码中支持非ASCII字符,必须在源文件的第一行或者第二行显示地指定编码格式: # coding=utf-8 或者是: #!/usr/bin/python # -*- coding: ...
- 【转】python编码规范
http://blog.csdn.net/willhuo/article/details/49300441 决定开始Python之路了,利用业余时间,争取更深入学习Python.编程语言不是艺术,而是 ...
- python 编码 UnicodeDecodeError
将一个py脚本从Centos转到win运行,出错如下: UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: il ...
- Python编码/文件读取/多线程
Python编码/文件读取/多线程 个人笔记~~记录才有成长 编码/文件读取/多线程 编码 常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...
随机推荐
- python-----列表生成式和列表生成器表达
列表表达式: 程序一: 常规写法: L = [] for x in range(1, 11): L.append(x * x) print(L) #[1, 4, 9, 16, 25, 36, 49, ...
- 洛谷P1155 双栈排序——思路题
题目:https://www.luogu.org/problemnew/show/P1155 思路... 看博客:https://www.cnblogs.com/Narh/p/9213825.html ...
- Java:EL表达式
ylbtech-Java:EL表达式 EL(Expression Language) 是为了使JSP写起来更加简单.表达式语言的灵感来自于 ECMAScript 和 XPath 表达式语言,它提供了在 ...
- 在WIN7里IE8的开发人员工具打不开的解决办法
IE8新增了开发人员工具,非常不错,比早期的DevToolbar好用多了.不过在我的Win7下使用的时候偶尔会出现一个莫名其妙的问题,就是整个开发人员工具窗口消失了,打不开了.当你使用win+Tab切 ...
- 用nginx进行同一个服务器下多域名的负载均衡配置
用nginx进行同一个服务器下多域名的负载均衡配置 Nginx进行http负载均衡的模块是upstream Upstream可以进行多个配置,这样的话可以灵活的配置站点,但是注意的是upstream后 ...
- Linux学习笔记之Linux用户与用户组、文件操作命令、文件权限剖析
1.用户与用户组 Linux是一个多用户操作系统,通过用户与用户组的概念,可以实现保证安全性和隐私性.任何一个文件都具有User.Group.Others三个权限. 文件拥有者(Linux下所有的东西 ...
- Java多线程(八) synchronized 抛出异常锁自动解除
当一个线程执行的代码出现异常时,其所持有的锁会自动释放 public class MyObject { private int i = 1; synchronized public void meth ...
- Apache Kafka官方文档翻译(原创)
Apache Kafka是一个分布式流平台.准确的说是什么意思呢?我们认为流平台具有三种关键能力: 1.让你对数据流进行发布订阅.因此他很像一个消息队列和企业级消息系统. 2.让你以高容错的方式存储数 ...
- mysql 更改字符集
Windows: 安装目录下新建my.ini文件,输入一下内容 [mysqld]#修改服务器端默认字符编码格式为utf8character-set-server = utf8 [client]#修改客 ...
- Angular——单页面与路由的使用
单页面 SPA(Single Page Application)指的是通单一页面展示所有功能,通过Ajax动态获取数据然后进行实时渲染,结合CSS3动画模仿原生App交互,然后再进行打包(使用工具把W ...