编码CODING】的更多相关文章

摘自(复制)于海燕博客: http://www.cnblogs.com/haiyan123/p/7230533.html 1.内存和硬盘都是用来存储的. CPU:速度快 硬盘:永久保存 2.文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开编辑器就可以启动一个进程,是在内存中的,所以在编辑器编写的内容也都是存放在内存中的,断电后数据就丢失了.因而需要保存在硬盘上,点击保存按钮或快捷键,就把内存中的数据保存到了硬盘上.在这一点上,我们编写的py文件(没有执行时),跟编写…
1.字符编码 #ASCII码里只能存英文和特殊字符 不能存中文 存英文占1个字节 8位#中文编码为GBK 操作系统编码也为GBK#为了统一存储中文和英文和其他语言文字出现了万国码Unicode 所有一个字符都占2个字节 16位#英文文档改为Unicode编码大小变大一倍 为解决这种浪费空间问题#出现了Unicode扩展集 Utf-8 为可变长的字符编码 默认英文字符按ASCII码存储 中文按照3个字节存储 编码都要先decode成unicode再转码成目标编码 #获取默认编码import sys…
老是碰到这个问题,决定好好给整理一番思路. 翻阅资料和实践证明,以下论述为真理: 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码.    即:   可以通过:sys.setdefaultencoding统一为decode和encode指定编码.默认情况下也是统一采用相同的方式decode和encode. 因此很多时候出错:…
运行报如下错误: SyntaxError: Non-ASCII character '\xe8' in file /home/ubuntu/code/201803091253-text.py on line 1, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details 解决方案: 在Python文件第一行,最前面加如下代码: # -*- coding: utf-8 -*-# 声明字符编码# co…
一 字符编码 储备知识点: 1.计算机系统分为三层: 应用程序 操作系统 计算机硬件 2.运行Python程序的三个步骤 1.先启动python解释器 2.再将python文件当做普通的文本文件读入内存 3.解释执行读入内存的代码,开始识别语法 字符编码 1.什么是字符编码 字符编码表:人类的字符<------------>数字 1Bytes=8bit 1B=8bit  1字节等于8个二进制 ASCII码:只能识别英文字符,1英文字符=8bit 用8个二进制bit(比特位)表示一个英文字符 G…
电脑最小储存单位是bit(位),8bit为一个Byte(字节), 8bit=1Byte 1024Byte=1KB 1024KB=1MB 1024MB=1GB 1024GB=1TB 编码的故事: 计算机是美国人发明的,最早只有127个字符编码,编码表被称为ASCII编码,中文怎么办?中国就把中文编进去,制定了GB2312编码,日本把日文编到Shift_JIS里,韩国把韩文编到Euc-kr里..............这样会出现什么情况,假如我一个本档的内容有中文,英文,显示就会乱码,我们说的乱码,…
本节内容 字符编码 文件操作 集合 一.字符编码 1.编码 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.解决思路:数字与符号建立一对一映射,用不同数字表示不同符号. ASCII(American Standard Code for Information Interchange, 美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言. 每个bit 有两种状态 0和1,ASCII码使用指定的8位二进制数组合来表示256种可能的字符 大…
py编码骨灰级总结 思路: python执行py文件步骤--py2/3定义变量时unicode差异 1,py2 py3执行py文件的步骤 2,py2 定义变量x='mao' 1.x='mao', # 以文件头编码,因此出现内存中不一定全是unicode 2,x=u'mao' # 等同于 x='mao'.decode('gbk'),从这里可以看出,站在unicode角度想问题 1,unicode在内存中 2,unicode内存存在硬盘,需encode,因此unicode可以encode到任意编码…
1.单行注释 以井号( # )开头,右边的所有内容当做说明2.多行注释 以三对单引号(’’’注释内容’’’)将注释包含起来以‘# ’是注释的标识符,可以记录当前代码所代表的意义,解释器会自动忽略这部分内容. 当语句以‘:’结尾时,缩进语句视为代码块. 在Python中,通常我们以4个空格的缩进来进行区分.可以在每句结束之后加一个‘;’号.通常在Python中,默认以换行为新的一行,若想在一行输入多句语句,一定要加‘;’,否则报错.注意:由于Python采用缩进的语法,在你复制,粘贴语句时,一定要…
ASCII 占一个字节,只支持英文 GB2312 占2个字节,只支持6700+汉字 GBK 是GB2312的升级版,支持21000+汉字 Shift-JIS 日本字符编码 ks_c-5601-1987 韩国字符编码 TIS-620 泰国编码 unicode 2-4个字节,兼容万国编码,对于汉字收录136690个,还在增加中... UTF-8 使用1,2,3,4个字节表示字符 关于unicode万国字符 1.直接支持全球所有语言,每个国家都可以不再使用自己之前的旧编码了 2.包含了跟全球所有国家编…