字符（存储了信息的东西）编码（）：

键盘发送的是电流--》主机（内存）接受到电流（当作010100110101）--》显示屏接受电流（当作010100110101-------》键盘）

编码：01001010101--》键盘

字符编码

文本编辑器存储信息的过程

文本编辑器--》写文本--》存储信息

显示屏（内存）---》（转换）硬盘

中文-->0101010101

English-->01010111101010

日本語-->0101101010

早期美国人才用计算机

0--》a

1--》b

0001--》a

0011--》b

...

1111--》w

0000 0000-->a

ascII编码--》美国人

print(chr(64))

print(ord('♂')）

#ascII编码的转换关系的方法

print(chr(64))

print(ord('♂')）

日本也要用计算机，韩国也要用计算机，中国也要用计算机

日本人也造一种编码shift_JIS shit

韩国人也造一种编码Euc-kr fuckr

中国人也造一种编码gb2312

我要在韩国人的电脑上写日文（0001 0010）----ab---》韩国--cd---》以前看片的乱码现象

早期各个国家只能使用各个国家的计算机--》天下大事分久必合合久必分

这个时候出现了unicode编码（内存）（一种对应关系）

unicode可以认识万国编码

硬盘中无论躺着什么格式的编码文件，Unicode都可以识别，假设你看岛国片，从硬盘中读取fuck编码，unicode帮你转换成gb2312，解决了乱码问题，用unicode存

都用unicode取，有用unicode存，以后写代码只能写Unicode--》以后全世界的代码都是Unicode

unicode存的时候会占用大量空间，所以出现了utf8（之和Unicode一一对应）--》解决了Unicode内存占用过多的问题

现在所有电脑都是这样的--》内存中Unicode取，存用utf8（硬盘）全世界的人写代码/写文件都用utf8

内存中为什么不用utf8？utf8和gb2312/fuck都没有转换关系，因此内存都要用unicode

未来迟早有一天内存要用utf8

gb2312和gbk的区别

先能用就行，不常用的词+繁体字

gb2312--》常用词

gbk--》所有字

Windows系统的笔记本默认编码是gbk，除此之外都是utf8

用什么编码写，就用什么编码读

写用utf8，读用gbk--》乱码

写用utf8，存用gbk --》乱码，读用--》除非你找日文编码的の（这是中文的一个符号，不是日文的の）

乱码发生在读的时候

用utf8的字符放入gbk

编码和解码

unicode编码--》（编码）utf8从内存到硬盘

utf8--》（解码）unicode从硬盘到内存

现在内存只有Unicode编码

python编辑器（文本编辑器）解释python代码的流程

1.python解释器相当于文本编辑器，把代码读入python解释器--》字符编码-》python2默认ascII码，python3默认utf8

中文#gbk编码的中文加上coding的头

1.加上coding头

2.识别代码--》print有意义

#coding gbk#告诉python解释器用gbk去完成第一步，读入字符

中文

3.产生结果--》跑到终端--》字符编码

终端有一个特性：你的电脑是什么编码的，就按照什么编码来，windows终端是utf-8

python2和python3的编码区别

python2

python2有两种存储变量的形式，第一种：unicode；第二种：按照coding头来的

假设python2用utf8存储x='中文',当你print(x)的时候，终端接收gbk的变量x，但是windows终端编码是utf8，会乱码

假设python2用unicode存储，终端接受的是unicode，windows终端编码是utf8还是gbk重要吗？不会乱码=

# coding:gbk

lt1 = '中文'  # utf存储的

# lt1 = ['中文']  # []让他不用终端的编码转化，显示01010101001

print lt1  # ['\xe4\xb8\xad\xe6\x96\x87']

lt2 = u'中文'  # u'中文'让他变成unicode  # 早期用python2定义中文，必须得加上u，让他变成unicode存储

# lt2 = [u'中文']

print lt2  # '中文'

python3

python3只有一种存储变量的形式，unicode

python3用unicode存储，终端接收的是unicode，widonws终端编码是utf还是gbk不重要，不会乱码

lt1 = '中文'  # == u'中文'

print(lt1)

字符编码到python编辑器流程的更多相关文章

字符编码和Python代码操作文件
字符编码和Python代码操作文件读写模式之a模式 # a模式只追加模式 # 路径不存在:自动创建 with open(r'a.txt','a',encoding='utf8') as f: pa ...
字符编码和python中的文件处理
字符编码与python文件处理 ---------------- 字符编码 1.常见的编码 ASCII: 美国人发明的,只编码英文字母和符号,1个字节. GB2312: 中国人发明的,增加了中文汉字和 ...
字符编码，python解释器------总结
目录 1. 编码: 1.字符编码 2. 编码的历史 3. 编码和解码 2. python解释器解释代码的流程 1. 读取文本到解释器 2. 识别代码(检查语法问题) 3. 往终端打印 1. 编码: ...
字符编码和python文件操作
字符编码和文件操作目录字符编码和文件操作 1. 字符编码 1.1 什么是字符编码 1.2 字符编码的发展史 1.2.1 ASCII码 1.2.2 各国编码 1.2.3 Unicode 1.3 字符 ...
字符编码和python .encode().decode()方法
字符编码与encode.decode的问题: 用8个开关表示世界万物 ASCII : American Standard Code for Information Interchange,美国 ...
字符编码和python使用encode,decode转换utf-8, gbk, gb2312
ASCII码标准ASCII码使用7位二进制数表示大写或小写字母,数字0到9标点符号以及在美式英语中使用的特殊控制字符. 在标准ASCII码中,最高位(b7)用作奇偶校验位,所谓奇偶校验,是指在代码传 ...
Python中的字符串与字符编码
本节内容: 前言相关概念 Python中的默认编码 Python2与Python3中对字符串的支持字符编码转换一.前言 Python中的字符编码是个老生常谈的话题,同行们都写过很多这方面的文章. ...
Python的字符编码
Python的字符编码 1. Python字符编码简介 1. 1 ASCII Python解释器在加载.py文件的代码时,会对内容进行编码,一般默认为ASCII码.ASCII(American St ...
深入理解Python的字符编码
原文:http://lukejin.iteye.com/blog/598303 在处理中文的时候,我们有时候会碰到中文乱码的问题. 究其根本原因是正确的字节序列按照错误的编码方式解码成字符或者正确的 ...

随机推荐

6. Python运算符之算术、比较、赋值运算符
什么是运算符?举个简单的例子 4 +1 = 5 . 例子中,4 和 1 被称为操作数,"+" 和"="称为运算符. 工作中用到的运算符主要有以下几种:算术运算符 ...
10、TestNG 的 FixTrue用法一
Fixture 是指一个测试运行所需的固定环境,通俗来说 ,为测试用例所准备的环境. 以下是TestNG中可用的注释及其属性的简要概述. 我们先演示@BeforeClass.@AfterClass.@ ...
[Flink原理介绍第四篇】：Flink的Checkpoint和Savepoint介绍
原文:https://blog.csdn.net/hxcaifly/article/details/84673292 https://blog.csdn.net/zero__007/article/d ...
Lung Nodule Detection------work log
有时候真的不知道自己是怎么走上,模式识别,人工智能的这条路上的.但既然走上了这条路,我就没有理由荒废我所学到的东西.在学校里面研究了很长的时间的肺结节检测,但那都是只限于研究和写论文,现在我想把大家的 ...
Rsync 恢复 libselinux.SO.1
libselinux.SO.1 这个文件对 CentOS 7很重要, 误删掉后,会导致很多命令无法使用(比如yum ,rpm 命令),利用rsync这个工具来修复. 服务端执行如下配置:(选取正常 ...
Ubuntu 更新国内镜像源失败
Ubuntu 更新国内镜像源失败首先打开系统原来的/etc/apt/sources.list 查看,原来的仓库地址是 https 还是 http 如果是http那么说明本机的 CA 证书有问题,运行 ...
unicode_stop - 撤销控制台unicode模式(例如, 回到8-bit模式).
总览 unicode_stop 描述 unicode_stop 撤销以前 unicode_start(1) 命令的效果, 将显示屏和键盘设回到 8-bit 模式.
数组foreach
简单使用代码 <!DOCTYPE html> <html lang="en"> <head> <meta charset="U ...
Hexo next主题添加站内搜索功能
根据关键字搜索博文,站内搜索的功能很实用.hexo开启站内搜索很方便,已经有现成的插件可以使用,也是为了方便自己安装插件 npm install hexo-generator-search --sa ...
svg实现绘制路径动画
1,首先用svg绘制一条path路径,然后进行如下操作 ps: 下面是svg中两个属性及值的意义 stroke-dasharray是让你指定画出的线段每段的长度,第二个值是各段之间空隙的长度. str ...

字符编码到python编辑器流程