17) 编码

18) Python3的执行过程

19) 常见编码错误原因

20) 后附一部分编码详细信息(个人总结,有误望指正)

想了解Python3的编码更细致的讲解请参考大王的文章

http://www.cnblogs.com/alex3714/articles/7550940.html

17,编码

Python2默认的文件编码是,ASCII

所以默认是不支持中文,若想支持中文,要在文件顶行写上

      #! -*- coding: utf-8 -*-

      #! encoding: utf-8

Python3默认的文件编码是,UTF-8

Windows中文版默认编码是,GBK

Linux / Mac OS默认编码是,UTF-8

18,Python3 的执行过程

1,解释器找到代码文件,把代码字符串按文件头定义的编码加载到内存,转成Unicode

       (可以把源文件看成一个很长的字符串)

2,把代码字符串按照语法规则进行语法分析

3,所有的变量字符都会以Unicode编码声明

Note

Python3源文件默认文件编码UTF-8

Python3解释器默认编码Unicode

Python2源文件默认文件编码ASCII

Python2解释器默认编码ASCII

在Python3中如果不使用默认编码,记得一定要在文件头声明;在PyCharm改没用

python3中:默认文件编码为UTF-8

加载到内存后成了Unicode

(其实不管声明文件编码为什么,到内存中都会转成Unicode,仅限Python3)

在Windows终端下执行,正常显示

虽然Windows CMD的编码是GBK,

但是Unicode的作用其中之一是有跟全球所有国家语言编码的映射关系

python2中:默认文件编码为ascii

加载到内存后还是ascii,

就算你声明了编码是utf-8,到内存后依然是utf-8,

(声明什么,内存中就是什么) 所以,

在Windows终端下执行,显示不正常

因为Windows CMD的编码是GBK,

GBK处理不了utf-8的编码

只有两种途径才能正常显示:

1,文件头声明编码为gbk

2,字符串显示地转成Unicode

19,常见编码错误的原因:

Python解释器的默认编码

Python源文件的文件编码

Terminal使用的编码

操作系统的语言设置

07 Python编码问题的更多相关文章

  1. 【转】Python——编码规范

    来自于 啄木鸟社区 Python Coding Rule --- hoxide 初译 dreamingk 校对发布 040724 --- xyb 重新排版 040915 --- ZoomQuiet M ...

  2. (转载) 浅谈python编码处理

    最近业务中需要用 Python 写一些脚本.尽管脚本的交互只是命令行 + 日志输出,但是为了让界面友好些,我还是决定用中文输出日志信息. 很快,我就遇到了异常: UnicodeEncodeError: ...

  3. Python 编码简单说

    先说说什么是编码. 编码(encoding)就是把一个字符映射到计算机底层使用的二进制码.编码方案(encoding scheme)规定了字符串是如何编码的. python编码,其实就是对python ...

  4. Python之路3【知识点】白话Python编码和文件操作

    Python文件头部模板 先说个小知识点:如何在创建文件的时候自动添加文件的头部信息! 通过:file--settings 每次都通过file--setings打开设置页面太麻烦了!可以通过:View ...

  5. python编码规范

    python编码规范 文件及目录规范 文件保存为 utf-8 格式. 程序首行必须为编码声明:# -*- coding:utf-8 -*- 文件名全部小写. 代码风格 空格 设置用空格符替换TAB符. ...

  6. 【转】python编码的问题

    摘要: 为了在源代码中支持非ASCII字符,必须在源文件的第一行或者第二行显示地指定编码格式: # coding=utf-8 或者是: #!/usr/bin/python # -*- coding: ...

  7. 【转】python编码规范

    http://blog.csdn.net/willhuo/article/details/49300441 决定开始Python之路了,利用业余时间,争取更深入学习Python.编程语言不是艺术,而是 ...

  8. python 编码 UnicodeDecodeError

    将一个py脚本从Centos转到win运行,出错如下: UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: il ...

  9. Python编码/文件读取/多线程

    Python编码/文件读取/多线程 个人笔记~~记录才有成长   编码/文件读取/多线程 编码 常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...

随机推荐

  1. Python Tricks(十九)—— switch 的实现

    python 原生语法不支持 switch,体现了 Python 大道至简的设计思路,有时为了避免啰嗦的 if elif等判断语句,我们可以用字典来代替 switch 的各分支,也即建立表达式和操作的 ...

  2. nodejs常用命令

    npm是一个node包管理和分发工具,已经成为了非官方的发布node模块(包)的标准.有了npm,可以很快的找到特定服务要使用的包,进行下载.安装以及管理已经安装的包. 1.npm install m ...

  3. 两个局域网(办公网-IDC)安全互通方案2:by GRE and linux server&深入理解GRE

    (0)gre的turnel的打通 1. 这个过程就是双方建立turnel的过程.           (1)局域网路由过程 1.主机A发送一个源为192.168.1.2,目的为10.1.1.2的包 ( ...

  4. 【转载】Java - Wait & Notify

    [本文转自]http://www.cnblogs.com/dolphin0520/p/3920385.html 这三个方法的文字描述可以知道以下几点信息: 1)wait().notify()和noti ...

  5. bzoj 1232: [Usaco2008Nov]安慰奶牛cheer【最小生成树】

    有趣 每条边在算答案的时候被算了二倍的边权值加上两个端点的权值,然后睡觉点额外加一次 所以可以用这个权做MST,然后加上点权最小的点 #include<iostream> #include ...

  6. [BZOJ:3162]:独钓寒江雪

    题解: 求本质不同的独立集的个数 首先独立集的个数是很好做的 \(f[u][0/1]\)表示节点\(u\)不选/选的方案数 然后dp就是 \(f[u][0] = f[u][0] * (f[v][0] ...

  7. MyEclipse无法自动编译项目故障一例

    MyEclipse导入项目后发现无法自动编译,classes目录下没有编译的类. 尝试的解决方法: 1.刷新项目,失败: 2.project->clean-,失败: 3.关闭项目再次打开,失败: ...

  8. MySQL replace into 用法(insert into 的增强版)

    转 http://blog.csdn.net/risingsun001/article/details/38977797 MySQL replace into 用法(insert into 的增强版) ...

  9. python程序展现图片

    突然想写一个python程序能够显示图片的 ,展示文字的已经实现了 现在就搞一搞这个吧 相信也是很简单 首先是放一张图片在e盘下面 等会程序打包的时候将会用到 就决定是你啦 皮卡丘: 然后就写代码吧:

  10. 238 Product of Array Except Self 除自身以外数组的乘积

    一个长度为 n 的整形数组nums,其中 n > 1,返回一个数组 output ,其中 output[i] 等于nums中除nums[i]以外所有元素的乘积.不用除法 且在O(n)内解决这个问 ...