python标准数据类型 Bytes

预备知识：

　　bin()：　

"""

    Return the binary representation of an integer.

       >>> bin(2796202)

       '0b1010101010101010101010'

    """

    pass

　　ord():

""" Return the Unicode code point for a one-character string. """

　　bytes类

"""

    bytes(iterable_of_ints) -> bytes

    bytes(string, encoding[, errors]) -> bytes

    bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer

    bytes(int) -> bytes object of size given by the parameter initialized with null bytes

    bytes() -> empty bytes object

    Construct an immutable array of bytes from:

      - an iterable yielding integers in range(256)

      - a text string encoded using the specified encoding

      - any object implementing the buffer API.

      - an integer

    """

　　python3中，字符串是unicode格式，字节包括utf-8,gbk等等，网络传输，硬盘保存是以字节格式保存的。

　　str和bytes格式的区别：

　　str：　

　　　　表现形式：a='hello,world'

　　　　内部原理：00000000 00000000 00000000 01101000 ‘h’

　　　　　　　　　。。。

　　bytes：

　　　　表现形式：a=b'hello,world'

　　　　内部原理：

　　　　　　　　01101000 utf-8

　　　　　　　　。。。

　　　　　　　　00000000 01101000 gbk

　　　　　　　　。。。

Bytes 对象是由单个字节作为基本元素（8位，取值范围 0-255）组成的序列，为不可变对象。

Bytes 对象只负责以二进制字节序列的形式记录所需记录的对象，至于该对象到底表示什么（比如到底是什么字符）则由相应的编码格式解码所决定。我们可以通过调用 bytes() 类（没错，它是类，不是函数）生成 bytes 实例，其值形式为 b'xxxxx'，其中 'xxxxx' 为一至多个转义的十六进制字符串（单个 x 的形式为：\xHH，其中 \x 为小写的十六进制转义字符，HH 为二位十六进制数）组成的序列，每两个十六进制数即每个‘x’代表一个字节（八位二进制数，取值范围 0-255），对于同一个字符串如果采用不同的编码方式生成 bytes 对象，就会形成不同的值。

Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。文本总是Unicode，由str类型表示，二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes，正是这使得两者的区分特别清晰。你不能拼接字符串和字节包，也无法在字节包里搜索字符串（反之亦然），也不能将字符串传入参数为字节包的函数（反之亦然）。

　　例如：

a='你好'

a_b=a.encode('utf-8')

print(a_b)

for i in a_b:

    print(i)

for i in a_b:

    print(bin(i))

　　输出：

b'\xe4\xbd\xa0\xe5\xa5\xbd'          #原来如此，\xe4 长得这么丑，实际是十六进制的数字。和128，12，没什么本质的区别。自然就可以bin()变为二进制数字了。

228

189

160

229

165

189

0b11100100

0b10111101

0b10100000

0b11100101

0b10100101

0b10111101

回到bytes和str的身上。bytes是一种比特流，它的存在形式是01010001110这种。我们无论是在写代码，还是阅读文章的过程中，肯定不会有人直接阅读这种比特流，它必须有一个编码方式，使得它变成有意义的比特流，而不是一堆晦涩难懂的01组合。因为编码方式的不同，对这个比特流的解读也会不同，对实际使用造成了很大的困扰。下面让我们看看Python是如何处理这一系列编码问题的：

>>> s = "中文"

>>> s

'中文'

>>> type(s)

<class 'str'>

>>> b = bytes(s, encoding='utf-8')

>>>b

 b'\xe4\xb8\xad\xe6\x96\x87'

>>> type(b)

<class 'bytes'>

从例子可以看出，s是个字符串类型。Python有个内置函数bytes()可以将字符串str类型转换成bytes类型，b实际上是一串01的组合，但为了在ide环境中让我们相对直观的观察，它被表现成了b'\xe4\xb8\xad\xe6\x96\x87'这种形式，开头的b表示这是一个bytes类型。\xe4是十六进制的表示方式，它占用1个字节的长度，因此”中文“被编码成utf-8后，我们可以数得出一共用了6个字节，每个汉字占用3个，这印证了上面的论述。在使用内置函数bytes()的时候，必须明确encoding的参数，不可省略。

我们都知道，字符串类str里有一个encode()方法，它是从字符串向比特流的编码过程。而bytes类型恰好有个decode()方法，它是从比特流向字符串解码的过程。除此之外，我们查看Python源码会发现bytes和str拥有几乎一模一样的方法列表，最大的区别就是encode和decode。

从实质上来说，字符串在磁盘上的保存形式也是01的组合，也需要编码解码。

如果，上面的阐述还不能让你搞清楚两者的区别，那么记住下面两几句话：

在将字符串存入磁盘和从磁盘读取字符串的过程中，Python自动地帮你完成了编码和解码的工作，你不需要关心它的过程。
使用bytes类型，实质上是告诉Python，不需要它帮你自动地完成编码和解码的工作，而是用户自己手动进行，并指定编码格式。
Python已经严格区分了bytes和str两种数据类型，你不能在需要bytes类型参数的时候使用str参数，反之亦然。这点在读写磁盘文件时容易碰到。

python标准数据类型 Bytes的更多相关文章

Python 标准数据类型
标准数据类型: Number(数字)----int float bool complex(复数) String(字符串) List(列表) Tuple(元组) Dictionary(字典) Set(集 ...
Python标准数据类型的二次加工
基于类继承的原理实现: class Li(list): #继承标准数据类型 list def app(self,p_object): #派生出新的 append功能 if not isinstance ...
python标准数据类型
Python3 中有六个标准的数据类型: Number(数字) String(字符串) List(列表) Tuple(元组) Sets(集合) Dictionary(字典) Python 中的变量不需 ...
Python：标准数据类型6种
#!/usr/bin/python3 #python的基本语法和数据类型 #python3中一行有多个语句,用分号分割(;) print("aaa") ;print(" ...
python基础之五大标准数据类型
学习一门语言,往往都是从Hello World开始. 但是笔者认为,在一个黑框框中输出一个"你好,世界"并没有什么了不起,要看透事物的本质,熟悉一门语言,就要了解其底层,就是我们常 ...
Python3基础教程2——Python的标准数据类型
2018年3月12日这次介绍一些python里面的标准数据类型当然还是推荐一个比较系统的教程 http://www.runoob.com/python3/python3-tutorial.html ...
python认知及六大标准数据类型
--- typora-root-url: assets --- ### -python的认知 ``` 89年开发的语言,创始人范罗苏姆(Guido van Rossum),别称:龟叔(Guido). ...
Python：6种标准数据类型
原文地址https://www.cnblogs.com/qin1991/p/5910145.html #!/usr/bin/python3 #python的基本语法和数据类型 #python3中一行 ...
python标准模块（二）
本文会涉及到的模块: json.pickle urllib.Requests xml.etree configparser shutil.zipfile.tarfile 1. json & p ...

随机推荐

springmvc 静态资源配置
SpringMVC提供<mvc:resources>来设置静态资源,但是增加该设置如果采用通配符的方式增加拦截器的话仍然会被拦截器拦截,可采用如下方案进行解决: 方案一.拦截器中增加针对静 ...
20135208 JAVA第三次实验
课程:Java实验班级:201352 姓名:贺邦学号:20135208 成绩: 指导教师:娄佳鹏实验日期:15.06.03 实验密级: ...
CS小分队第二阶段冲刺站立会议（5月26日）
昨天成果:对扫雷进行了全面的优化,增加了特色皮肤,为其添加了游戏音效,并且做出了换肤的接口. 今日计划:应队友要求对抽号倒计时器进行分离,修改界面结构以便美化. 遇到问题:扫雷的界面美化比较困难,自动 ...
Dijkstra+优先队列模板
#include<bits/stdc++.h> using namespace std; #define ll long long ; const ll inf=1e17; struct ...
CA如何吊销签署过的证书
1: 客户端获取要吊销证书的serial(在使用证书上的主机执行) openssl x509 -in httpd.crt -noout -serial -subject 2:拿到证书的编号后,通过 ...
PHP中普通方法和静态方法
普通方法(实例方法) 一个类中定义的方法,可以为这个类的所有对象调用的方法.也可以理解为,这个类的所有对象,都各自有自己的一个该方法: 定义形式: class 类名{ function 方法名(形 ...
Linux 重定向输出到多个文件中
转自:http://codingstandards.iteye.com/blog/833695 用途说明在执行Linux命令时,我们可以把输出重定向到文件中,比如 ls >a.txt,这时我们 ...
如何让TEdit在获取输入焦点后selectAll?
关于网友提出的“ 如何让TEdit在获取输入焦点后selectAll?”问题疑问,本网通过在网上对“ 如何让TEdit在获取输入焦点后selectAll?”有关的相关答案进行了整理,供用户进行参考,详 ...
最大流算法-ISAP
引入最大流算法分为两类,一种是增广路算法,一种是预留推进算法.增广路算法包括时间复杂度\(O(nm^2)\)的EK算法,上界为\(O(n^2m)\)的Dinic算法,以及一些其他的算法.EK算法直接 ...
Django 2.0 学习(18)：Django 缓存、信号和extra
Django 缓存.信号和extra Django 缓存由于Django是动态网站,所以每次请求均会去数据库进行相应的操作,当程序访问量大时,耗时必然会显著增加.最简单的解决方法是:使用缓存,缓存将 ...

python标准数据类型 Bytes

python标准数据类型 Bytes的更多相关文章

随机推荐

热门专题