2.内存和硬盘:

内存:计算机硬件组成部分之一,它是一个容器,用来存储数据;处理数据速度快,

存储数据量小;断电死机数据会丢失,短暂性存储数据

硬盘:计算机硬件组成部分之一,它是一个容器,用来存储数据;处理数据速度慢,

存储数据量大,断电死机数据不会丢失,数据的持久存储

3.字节和字符

字节:计算机的存储数据的单位,底层唯一能够识别并且运算的数据

字符:人类将字节封装为另一种能直接识别的数据单位,底层还是字节

4.如何区分字节文件和字符文件

如果使用文本编辑器打开能看得懂(不会乱码)那它就是一个字符文件,

反之,它是一个字节文件

提问:常见的字节文件和字符文件有哪些?(枚举出一些)

字节文件:图片文件(.jpg、.png...)、视频文件(.avi、.mp4、.rmb...)、音频文件(.mp3...)

字符文件:.txt、.py、.java、.js、.html、.css、.php...

思考:.doc结尾的文件是字节还是字符文件?

是字节文件,因为.doc结尾的文件中既可以包含字符内容,也可以包含图片、颜色设置...操作

思考:计算机数据层面,一切皆字节,对不对?

对的;因为计算机底层唯一能够识别和运算的都是字节数据...

5.字符编码(字符集)

ascii码表:U.S.A设计出来的,范围非常小;不包含很多国家的文字,英文字符占用内存1个字节

utf-8码表:现今比较通用的一张编码表,包含了世界上所有的文字内容,范围:0~65535之间,

1个汉字占用内存3个字节,1个英文字符占用内存1个字节

gbk码表:gbk属于gb2312的扩充版,兼容了gb2312中的所有字符,加入更多的一些汉字内容,

1个汉字占用内存2个字节,1个英文字符占用内存1个字节,

在我们中国环境下,大多数情况默认的都是gbk作为编码

6.编码和解码:

编码:让数据从看的懂到看不懂,就是编码

解码:让数据从看不懂到看得懂,就是解码

【注意】

编码和解码如果不一致会怎么样?

1).会出现乱码现象

2).会报错

不管是上述的1还是2都是不理想的结果,我们都需要避免

字符串的两个函数引入:

encode(encoding,errors):对字符串数据进行编码操作,得到一个bytes类型的数据

decode(encoding,errors):对字符串数据进行解码操作,得到一个str类型的数据

演示eccode()和decode()函数的使用:
str1='哈哈呵呵'

#编码:encode()
b=str1.encode(encoding='utf-8')
print(b,type(b)) #解码:decode()
str2=b.decode('utf-8','ignore')
print(str2,type(str2))

python第二十八课——编码小常识的更多相关文章

  1. python第二十九课——文件读写(读取读取中文字符)

    演示:读取中文字符 结论: 1).如果不设置encoding,默认使用gbk进行编解码 2).如果编码和解码不一致,最终导致报错,但是一旦设置了errors='ingore',那么就不会报错,而采取乱 ...

  2. NeHe OpenGL教程 第二十八课:贝塞尔曲面

    转自[翻译]NeHe OpenGL 教程 前言 声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线 ...

  3. python第二十九课——文件读写(复制文件)

    自定义函数:实现文件复制操作有形参(2个) 没有返回值相似版(不用) def copyFile(src,dest): #1.打开两个文件:1个关联读操作,1个关联写操作 fr=open(src,'rb ...

  4. Python学习第二十八课——Django(templates)

    templates 讲后台得到的数据渲染到页面上:话不多说,先看具体代码. urls: from django.conf.urls import url from django.contrib imp ...

  5. Python学习第二十八课——Django(urls)

    Django框架中的urls配置: 首先通过pycharm创建一个Django项目: 例如要写blog的功能:则在digango_lesson中的urls代码如下: """ ...

  6. python六十八课——网络编程之UDP协议

    1.1 概述 UDP是无连接通信协议,即在数据传输时,数据的发送端和接收端不建立逻辑连接.简单来说,当一台计算机向另外一台计算机发送数据时,发送端不会确认接收端是否存在,就会发出数据,同样接收端在收到 ...

  7. 第二十八课:focusin与focusout,submit,oninput事件的修复

    focusin与focusout 这两个事件是IE的私有实现,能冒泡,它代表获得焦点或失去焦点的事件.现在只有Firefox不支持focusin,focusout事件.其实另外两个事件focus和bl ...

  8. 潭州课堂25班:Ph201805201 django 项目 第二十八课 新闻elasticsearch搜索前后功台能实现 (课堂笔记)

    后端功能实现 文件,类,字段,命名不要改动, 在apps/news/search_indexes.py中创建如下类:(名称固定为search_indexes.py) # -*-# -*- coding ...

  9. python五十八课——正则表达式(替换)

    替换:sub(regex,repl,string,count,[flags=0]): 替换数据,返回字符串(已经被替换完成后的内容)subn(regex,repl,string,count,[flag ...

随机推荐

  1. [转]Magento刷新索引的几种方法

    本文转自:https://blog.csdn.net/IT_Wallace/article/details/78513951 在数据表中经常会使用索引,下面简单介绍一下索引的利弊: 创建索引可以大大提 ...

  2. SQL SERVER中LIKE使用变量类型输出结果不同

    前言:Sql Server中LIKE里面使用不同的变量类型导致查询结果不一致的问题,其实看似有点让人不解的现象背后实质跟数据类型的实现有关. 一.我们先来创建示例演示具体操作 CREATE TABLE ...

  3. C++虚析构函数解析

    当派生类对象从内存中撤销时一般先运行派生类的析构函数,然后再调用基类的析构函数. 如果用new运算符建立的派生类的临时对象,对指向基类的指针指向这个临时对象当用delete运算符撤销对象时,系统执行的 ...

  4. echart 数据视图 样式重写

    来源http://blog.csdn.net/u010705091/article/details/75212724 echarts折线图的数据视图样式重写 在echarts.js中,点击折线图的数据 ...

  5. ELK环境搭建完整说明

    ELK环境搭建完整说明 ELK:ElasticSerach.Logstash.Kibana三款产品名称的首字母集合,用于日志的搜集和搜索.简单地理解为我们可以把服务端的日志(nginx.tomcat等 ...

  6. SSH无密码登录的原理及配置

    一.SSH概念(百度) SSH 为 Secure Shell 的缩写,由 IETF 的网络小组(Network Working Group)所制定:SSH 为建立在应用层基础上的安全协议.SSH 是目 ...

  7. SpringBoot结合Swagger2自动生成api文档

    首先在pom.xml中添加如下依赖,其它web,lombok等依赖自行添加 <dependency> <groupId>io.springfox</groupId> ...

  8. PHP定界符<<<eof 使用

    PHP是一个Web编程语言,在编程过程中难免会遇到用echo来输出大段的html和javascript脚本的情况,如果用传统的输出方法 ——按字符串输出的话,肯定要有大量的转义符来对字符串中的引号等特 ...

  9. Android:Error:Execution failed for task ':app:clean'. > Unable to delete directory

    as  clean项目之后有时候会报错. 可以找得到目录删掉,然后重启as,但是下次clean可能又会报类似的错误. 解决方法如下: 进入File-Setting-Build,Execution,De ...

  10. Hive使用SequenceFile存储数据

    SequenceFile是使用二进制保存数据,是可以压缩的,并且压缩后的数据可被分割,可以供mapreduce处理. 下面的实例使用SequenceFile保存Hive表的数据,并且使用了压缩. se ...