深入set和dict

一. 浅拷贝和深拷贝

浅拷贝：就是创建一个具有相同类型，相同值但不同id的新对象。

浅拷贝产生的新对象中可变对象的值在发生改变时，会对原对象的值也做出改变，因为这些值是同一个引用。

a = [1, 2]

b = [3, 4, a]

c = b.copy()

a[0] = 0

print(b)

print(c)

输出

[3, 4, [0, 2]]

深拷贝：不仅仅拷贝了原始对象自身，也对其包含的值进行拷贝，它会递归的查找对象中包含的其他对象的引用，来完成更深层次拷贝。

深拷贝产生的副本可以随意修改而不需要担心会引起原始值的改变

import copy

a = [1, 2]

b = [3, 4, a]

c = copy.deepcopy(b)

a[0] = 0

print(b)

print(c)

输出结果

[3, 4, [0, 2]]

[3, 4, [1, 2]]

二. dict的常用方法

1. fromkeys把可迭代的对象转变为dict

基本语法：dict.fromkeys(可迭代对象作为keys，默认值作为value）

new_list = ["name1", "name2"]

new_dict = dict.fromkeys(new_list, 34)

print(new_dict)

输出如下

{'name1': 34, 'name2': 34}

2. clear，清空字典中数据

a = {"name1": "jack", "name2": "jane"}

print(a)

a.clear()

print(a)

输出如下

{'name2': 'jane', 'name1': 'jack'}

{}

3. copy(这里是浅拷贝)

a = {"name1": "jack", "name2": "jane"}

print(a)

b = a.copy()

print(b)

# 修改a的值后，b也会跟着改变；同样如果修改b，a也会相应改变

a["name1"] = "hong"

print(a)

b = a.copy()

print(b)

输出如下

{'name2': 'jane', 'name1': 'jack'}

{'name2': 'jane', 'name1': 'hong'}

4. get，避免字典中keyerror异常

语法：a.get(键名，默认值）如果字典a中没有某个键名，就返回默认值

a = {"name1": "jack", "name2": "jane"}

value = a.get("name3", "not exist")

print(value)

输出如下

not exist

5. setdefault()，和get()相似，不同的是如果没有某个键名，会把此键名和默认值加入到字典中

a = {"name1": "jack", "name2": "jane"}

# 没有指定键名时

a.setdefault("name3", "not exist")

print(a)

# 存在此键名时

b=setdefault("name1", "not exist")

print(b)

输出如下

{'name2': 'jane', 'name3': 'not exist', 'name1': 'jack'}

jack

6. update(), 可用于添加字典元素

a = {"name1": "jack", "name2": "jane"}

# 直接添加字典方式

a.update({"name3": "hong"})

print(a)

# 使用参数名方式

a.update(name4="lilei", name5="mei")

print(a)

# 使用list嵌套tuple方式，同样的tuple也可以嵌套tuple

a.update([("name6", "tiger"), ("name7", "monkey")])

print(a)

输出如下

{'name2': 'jane', 'name1': 'jack', 'name3': 'hong'}

{'name2': 'jane', 'name1': 'jack', 'name4': 'lilei', 'name5': 'mei', 'name3': 'hong'}

{'name6': 'tiger', 'name1': 'jack', 'name4': 'lilei', 'name3': 'hong', 'name7': 'monkey', 'name2': 'jane', 'name5': 'mei'}

三. set和frozenset（不可变集合）

特点：元素不会重复，无序性，里面的对象需要是可迭代，使用hash方式能很高

frosenset无法使用add函数添加值

1. 初始化方法

# 使用set关键字

s1 = set('abc')

#使用{}

s2 = {'a', 'b'}

print(type(s1), type(s2))

输出

2. 添加元素方式

# 使用add()函数

s1 = set('abc')

s1.add('d')

print(s1)

# 使用update()函数

s2 = set('xy')

s1.update(s2)

print(s1)

输出

{'a', 'c', 'd', 'b'}

{'b', 'a', 'x', 'c', 'y', 'd'}

3. difference()函数来求两个集合的差集

s1 = set('abc')

s2 = set('cd')

# 相当于s1 - s2

re_set = s1.difference(s2)

print(re_set)

输出结果如下

{'b', 'a'}

注意：difference()函数会返回一个新值，不会修改原数据

4. 集合的并集，交集

s1 = set('abc')

s2 = set('cd')

# 交集

re_set1 = s1 & s2

# 并集

re_set2 = s1 | s2

print(re_set1, re_set2)

输出结果如下

{'c'} {'c', 'a', 'b', 'd'}

5. issubset()判断集合A是否为集合B的子集

s1 = set('abc')

s2 = set('c')

print(s2.issubset(s1))

输出结果为True

四. dict和set的内部实现原理

1. list和dict的性能比较

1）dict的查找性能远大于list

2）在list中随着list数据量的增大，查找相同数据量的时间也会增大

3）在dict中随着dict数据量的增大，查找相同数据量的时间不怎么受影响

2. hash表数据存储实现图

1）右侧是hash表的存储结构，是一个数组，使用了一段连续的内存空间

2）字典中的key进行hash计算得到一个hash值，然后和7进行与的位运算后，得到一个值，比如是0，就把dict中的键值对放到0的这个内存位置

3）不同的key进行hash计算后，可能会得到一个相同的hash值，从而造成冲突；为解决这个问题，可按照一种机制重新进行hash计算。

4）声明数组的时候，分配的内存空间会比实际的dict数据量大

5）只须根据dict的key找到数组中的前面的偏移量，即可得到相应的键值对，复杂度为O(1)

3. 哈希表查找原理图

说明：

1）表元就是哈希图中最右侧存储键值对的地方

2）散列冲突就是hash冲突

3）造成散列冲突时，会多取几位散列值来定位表元。

4. dict原理小结

1）dict的key或者set的值都必须是可hash的，他们的实现原理相同。不可变对象都是可hash的，比如string， tuple， fronzenset

2）dict的内存花销大，但是查询速度快；自定义的类中，只要加上魔法函数__hash__, 那么这个类就是可hash的

3）dict的存储顺序和元素添加顺序有关，因hash值冲突的原因

4）添加数据的时候有可能会改变已有数据的顺序：存储dict的时候，python会预先申请一段大于dict数据需求的连续内存空间，以减少hash冲突的概率，当添加数据量使得大于分配内存空间的1/3的时候，python就会另申请一个较大的内存空间，把原先的数据进行迁移，重新进行hash值的计算

深入set和dict的更多相关文章

tuple放入dict中
tuple放入dict中是否可以正常运行 # 将tuple放入dict中 a = ('AI','Kobe','Yao') b = ('AI',['Kobe','Yao']) dict1 = {'a': ...
redis数据结构存储Dict设计细节（redis的设计与实现笔记）
说到redis的Dict(字典),虽说算法上跟市面上一般的Dict实现没有什么区别,但是redis的Dict有2个特殊的地方那就是它的rehash(重新散列)和它的字典节点单向链表. 以下是dict用 ...
python list dict 去重的两种方式
def dedupe(items, key=None): seen = set() for item in items: val = item if key is None else key(item ...
list,tuple,dict,set常用方法
Python中list,tuple,dict,set常用方法 collections模块提供的其它有用扩展类型 from collections import Counter from collect ...
python dict clear只能删除一层，不能够递归删除。
void PyDict_Clear(PyObject *op) { dictobject *mp; dictentry *ep, *table; int table_is_malloced; Py_s ...
Python中内置数据类型list,tuple,dict,set的区别和用法
Python中内置数据类型list,tuple,dict,set的区别和用法 Python语言简洁明了,可以用较少的代码实现同样的功能.这其中Python的四个内置数据类型功不可没,他们即是list, ...
python第一天 - dict
dict key-value集合. d = { ': 'a', ': 'b', ': 'c' } (一).获取集合长度:len(d) = 3(二).获取值: 方式一:d[key];例:d['1'] = ...
python利用dict模拟switch
pytho本身并未提供switch语句,但可以通过dict来模拟switch, #方法1 def add(x,y): return x+y def dec(x,y): return x-y def m ...
python-list tuple dict set
1:删除一个列表末尾的元素 pop方法 >>> a [1, 'Jack', 2, 3, 2] >>> a.pop() >>> a [1, 'Jac ...
python基础之dict、set及字符
python基础之dict.set及字符串处理本节内容字典介绍及内置方法集合介绍字符串处理 1.字典介绍及内置方法字典是python中唯一的映射类型,采用键值对(key-value)的形式存 ...

随机推荐

C语言基础第三次作业
题目7-1,寻找最小值 1.实验代码: #include<stdio.h> int main() { int i,mark,min,n; scanf("%d", &am ...
Python GUI 编程
Python GUI编程(Tkinter) Python 提供了多个图形开发界面的库,几个常用 Python GUI 库如下: Tkinter: Tkinter 模块(Tk 接口)是 Python 的 ...
2018.09.08 NOIP模拟 division（状压dp）
这么sb的题考场居然写挂了2233. 假设n=∏iaiki" role="presentation" style="position: relative;&qu ...
C++/C头文件 .h和 .c
在C语言家族程序中,头文件被大量使用.一般而言,每个C++/C程序通常由头文件(header files)和定义文件(definition files)组成.头文件作为一种包含功能函数.数据接口声明的 ...
HDU 2546 饭卡（01背包问题）
题意:中文的吧,飘过~ 析:学过DP的都应该感觉到是动态规划吧,就是一个01背包问题,不同的是,这个题又加入一些新的条件,就是不满5元不能消费,过了5元即使超了也行(这个学校真不错,都可以预支),最后 ...
JSTL 、 OGNL 与 EL
JSTL: JSP Standard Tag Library OGNL:Object-Graph Navigation Language EL:Expression Language action 中 ...
ASYNC PROGRAMING IN JAVASCRIPT[转]
本文从异步风格讲起,分析Javascript中异步变成的技巧.问题和解决方案.具体的,从回调造成的问题说起,并谈到了利用事件.Promise.Generator等技术来解决这些问题. 异步之殇 NON ...
PhotoModeler Scanner教程
Marking and Referencing 标记和校正标记和校正是通过多张照片人工匹配共同特征的过程.点击一张图片的明显视觉特征,然后将它匹配到不同角度拍摄的其他图片的相同特征上. Approp ...
【翻译】追溯“typeof null”的历史
我的翻译小站:https://www.zcfy.cc/article/the-history-of-typeof-null 翻译原文链接:http://2ality.com/2013/10/typeo ...
20155320 2016-2017-2 《Java程序设计》第7周学习总结
20155320 2016-2017-2 <Java程序设计>第7周学习总结教材学习内容总结时间与日期认识时间与日期时间的度量 GMT(Greenwich Mean Time)时间 ...

深入set和dict

深入set和dict的更多相关文章

随机推荐

热门专题