python集合、字符编码、bytes与二进制

集合

　　用括号表示{ }，可以包含多个元素，用逗号分割

用途

　　用于关系运算

集合特点

1.每个元素是不可变类型

2.没有重复的元素

3.无序

应用

1.set去重

set(names)的功能是将列表转换成集合，并去除重复值

但是因为集合里面的元素时不可变的，所以set在去重时对象所包含的值不能有不可变类型，例如不能有 [ ]{ }

names=['zhangsan','lisi','wangwu','zhangsan','zhaoliu']

s=set(names)

print(s)

E:\PycharmProjects\untitled\venv\Scripts\python.exe E:/PycharmProjects/untitled/平时问题积累.py

{'zhangsan', 'lisi', 'zhaoliu', 'wangwu'}

2.合集功能

pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'}

linuxs={'wupeiqi','oldboy''gangdan',}

# 1.长度

print(len(pythons))

# 2.成员运算 True  False

print('alex' in pythons)

# 3.并集(2个变量合并，重复元素只取一个)

print(pythons | linuxs)

# 4.交集（ 取出同值）

print(pythons & linuxs)

# 5.对称差集（剔除共同值，合并其他值）

print(pythons ^ linuxs)

# 5.差集（左-右 剔除右边元素里面和左相同值 ，最后打印左边剩余的）

print(pythons - linuxs)

E:\PycharmProjects\untitled\venv\Scripts\python.exe E:/PycharmProjects/untitled/平时问题积累.py

6

True

{'yuanhao', 'oldboygangdan', 'alex', 'gangdan', 'wupeiqi', 'egon', 'biubiu'}

{'wupeiqi'}

{'yuanhao', 'oldboygangdan', 'egon', 'alex', 'biubiu', 'gangdan'}

{'yuanhao', 'egon', 'biubiu', 'alex', 'gangdan'}

s1={1,2,3,4,5}

s2={1,2,3,}

# 6.相等

print(s1 == s2)

# 7.父集(包含关系)

print(s1 >= s2)

# 8.父集（被包含关系）

print(s2 <= s1)

E:\PycharmProjects\untitled\venv\Scripts\python.exe E:/PycharmProjects/untitled/平时问题积累.py

False

True

True

字符编码

如何理解字符编码：将人类的字符编码/转换成计算机能识别的数字，这种转换必须遵循一套固定的标准，

该标准无非是，人类字符与数字的对应关系，称之为字符编码表。

A---->0000 0000      bit：是二进制位   byte：字节

B---->0000 0001

c---->0000 0002

d---->0000 0003

unicode与utf-8理解

1个英文字母=8bit=1bytes

英文字符：ASCII码表：用1Bytes表示一个英文字符

　　　　　1英文字符=8bit=1Bytes

中文字符：GBK：用2Bytes表示一个中文字符，1Bytes去表示英文字符

unicode:内存中使用的是unicode编码，unicode把全世界的字符都建立好对应关系

        　　用2Bytes去表示一个字符

utf-8 #unicode tranform format-8

utf-8 用1Bytes表示英文，用3Bytes表示中文

字符编码需要记住的概念：

01：内存中固定使用unicode编码，我们唯一可以改变的存储到硬盘时使用的编码

02： 要想保证存取文件不乱乱码，应该保证文档当初是以什么编码格式存的，就应该以什么编码格式去读取

字符编码应用：

1）pyhton2

在python2中有两种字符串编码格式

        1、unicode：

            x=u'上'    x为unicod类型

        2、unicode编码后的结果

            x='上' #如果文件头为coding:utf-8,那么"上"被存成utf-8格式的二进制      x为str类型

    在python3只有一种字符串编码格式：

        1、unicode

            x='上’    x为str类型

书写

#***

#coding:gbk

x='上’

x.decode('gbk')

#coding:gbk

x=u'上'

x.encode('gbk')

x.encode('utf-8')

理解编码与解码

unicode-------编码encode-------->gbk

unicode<-------解码decode--------gbk

2）Python3

   在python3中（*****）

    x='上'

    x只能进行编码

    x.encode('gbk')

3）Pyhton2与Python3使用总结

总结python2与python3：

        (***)

        在python2中的字符粗类型str都是unicode按照文件头的指定的编码，编码之后的结果

        在python2中也可以制造unicode编码的字符串。需要在字符串前加u

        (*****)

        在python3中的字符串类型str都是unicode编码的

        所以python3中的字符串类型可以编码成其他字符编码格式，编码的结果

        是bytes类型

Bytes类型与二进制的演变：

#看“中”bytes—二级制之间的转换

res='中'.encode('utf-8')

print(res)  #b'\xe4\xb8\xad'

#循环取出这个bytes

for i in b'\xe4\xb8\xad':

    print(i)

'''

228

184

173

'''

#发现字符“中”由三个3位数据构成，即228 184 173，

# 将其转化成二进制格式

print(bin(228)) #0b11100100

print(bin(184)) #0b10111000

print(bin(173)) #0b10101101

#二进制，即在计算机中的存储方式

#发现字符“中”的utf-8编码方式为：11100100 10111000 10101101，这也是它在计算机中存储的方式。

#ASCII码能够表示的字符（0-9a-zA-Z及一些标点符号转义字符等）转化成utf-8码不发生改变，因为utf-8编码是ASCII编码的超集。

res1='afAFA!@#'.encode('utf-8')  #b'afAFA!@#'

print(res1)

#而实际上存储的是各字符的ASCII码值：

for j in b'afAFA!@#':

     print(j)

'''

97

102

65

70

65

33

64

35

'''

python集合、字符编码、bytes与二进制的更多相关文章

Python基础-字符编码与转码
***了解计算机的底层原理*** Python全栈开发之Python基础-字符编码与转码需知: 1.在python2默认编码是ASCII, python3里默认是utf-8 2.unicode 分为 ...
Python常见字符编码间的转换
主要内容: 1.Unicode 和 UTF-8的爱恨纠葛 2.字符在硬盘上的存储 3.编码的转换 4.验证编码是否转换正确 5.Python bytes类型前 ...
python 3字符编码
python 3字符编码官方链接:http://legacy.python.org/dev/peps/pep-0263/ 在Python2中默认是ascii编码,Python3是utf-8编码在p ...
转：Python常见字符编码及其之间的转换
参考:Python常见字符编码 + Python常见字符编码间的转换一.Python常见字符编码字符编码的常用种类介绍第一种:ASCII码 ASCII(American Standard Cod ...
Python常用字符编码（转）
Python常用字符编码字符编码的常用种类介绍第一种:ASCII码 ASCII(American Standard Code for Information Interchange,美国信息交 ...
Python 的字符编码
配置: Python 2.7 + Sublime Text 2 + OS X 10.10 本文意在理清各种编码的关系并以此解决 Python 中的编码问题. 1 编码基本概念只有先了解字符表.编码字 ...
python（字符编码与转码）
一.字符编码演变史二进制(0 1) """ 算机中的所有数据,不论是文字.图片.视频.还是音频文件,本质上最终都是按照类似 01010101 的二进制存储的,再说简单点 ...
Python的字符编码
Python的字符编码 1. Python字符编码简介 1. 1 ASCII Python解释器在加载.py文件的代码时,会对内容进行编码,一般默认为ASCII码.ASCII(American St ...
python的str，unicode对象的encode和decode方法, Python中字符编码的总结和对比bytes和str
python_2.x_unicode_to_str.py a = u"中文字符"; a.encode("GBK"); #打印: '\xd6\xd0\xce\xc ...
python之----------字符编码具体原理
1.内存和硬盘都是用来存储的. CPU:速度快硬盘:永久保存 2.文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开编辑器就可以启动一个进程,是在内存中的,所以在编辑器编 ...

随机推荐

SingletonLoginUser
package cn.com.jgt.view{ import flash.errors.IllegalOperationError; /** * actionscript类的构造方法不能是priva ...
RYU的GUI安装
1. RYU安装 Ubuntu14.04 LTS 1.sudo apt-get install git python-pip libxml2-dev libxslt1-dev python2.7-de ...
BOM属性对象方法
本文原链接:https://cloud.tencent.com/developer/article/1018747 BOM 1.window对象 2.location对象 3.history对象 BO ...
python判断平衡二叉树
题目:输入一棵二叉树,判断该二叉树是否是平衡二叉树.若左右子树深度差不超过1则为一颗平衡二叉树. 思路: 使用获取二叉树深度的方法来获取左右子树的深度左右深度相减,若大于1返回False 通过递归对 ...
vue入坑教程（二）在vue项目中如何导入element以及sass
在项目中导入element以及sass.stylus等方便开发的工具以及UI框架 (1)如何在vue项目中导入elementUI框架 elementUI是饿了么团队开发出来基于vue的前端UI框架,其 ...
Mybatis中关于OGNL表达式冲突
注意设计表字段不能用bor xor and band eq neq lt gt lte gte shl shr ushr
vue 报错unknown custom element解决方法
原因: 没有引入相关组件导致的解决办法: 如果组件是按需引入的必须引入你当前用到的组件,否则会报错
VS Code：设置多行注释快捷键
多行注释,也叫块注释. 如何查看,并修改VS Code中的多行注释快捷键呢? 1). 点击首选项 - 键盘快捷方式 2). 在搜索框中输入 comment 3). 这个时候可以看到“切换块注释”的信 ...
cocos2dx 单张图片加密
cocos2dx 已经封装好读取加密的prv文件的方法,打开texturepacker,导入一张图片,在content protection中写入密钥,在texture format中选择prv格式 ...
【转】MFC右键显示菜单之LoadMenu()
如何在界面内单击右键弹出自己设置的菜单选项? 步骤如下: 1.在资源MENU里添加一个菜单资源,命名为IDR_POP_MENU. 2.在自己添加的菜单中添加事件,如事件1,事件2,事件3,分别添加响应 ...

python集合、字符编码、bytes与二进制

python集合、字符编码、bytes与二进制的更多相关文章

随机推荐

热门专题