使用deque模块固定队列长度,用headq模块来查找最大或最小的N个元素以及实现一个优先级排序的队列
一. deque(双端队列)
1. 使用 deque(maxlen=N)会新建一个固定大小的队列。当新的元素加入并且这个队列已满的时候,最老的元素会自动被移除掉
>>> from collections import deque >>> q = deque(maxlen=)
>>> q.append()
>>> q.append()
>>> q.append()
>>> q
deque([, , ], maxlen=)
>>> q.append()
>>> q
deque([, , ], maxlen=)
>>> q.append()
>>> q
deque([, , ], maxlen=)
2. 如果你不设置最大队列大小,那么就会得到一个无限大小队列,你可以在队列的两端执行添加和弹出元素的操作
from collections import deque >>> q = deque()
>>> q.append()
>>> q.append()
>>> q.append()
>>> q
deque([, , ])
>>> q.appendleft()
>>> q
deque([, , , ])
>>> q.pop() >>> q
deque([, , ])
>>> q.popleft()
优点:使用deque在两端插入或删除元素时间复杂度都是 O(1) ,而在列表的开头插入或删除元素的时间复杂度为 O(N) 。
二. headq模块
1. 堆数据结构最重要的特征是 第一个元素 永远是最小的元素;创建一个堆队列,可以使用一个列表[],也可以使用heapify(x)函数
#使用空列表的方法
h = [] heapq.heappush(h, )
heapq.heappush(h, )
heapq.heappush(h, )
heapq.heappush(h, )
print(h)
print(heapq.heappop(h)) #heappop方法会先将第一个元素弹出来,然后用下一个最小的元素来取代被弹出元素,这种操作时间复杂度仅仅是 O(log N),N是堆大小 结果输出如下:
[, , , ] # 使用heapify的方法,转换一个列表为堆排序
h = [, , , , , , ]
heapq.heapify(h)
print(h) 结果输出如下:
[, , , , , , ]
2. heapq 模块有两个函数:nlargest() 和 nsmallest() 可用来查找最大或最小的N个元素
import heapq
nums = [, , , , , -, , , , , ]
print(heapq.nlargest(, nums)) # Prints [, , ]
print(heapq.nsmallest(, nums)) # Prints [-, , ]
3. 两个函数都能接受一个关键字参数key,用于更复杂的数据结构中
import heapq portfolio = [
{'name': 'IBM', 'shares': , 'price': 91.1},
{'name': 'AAPL', 'shares': , 'price': 543.22},
{'name': 'FB', 'shares': , 'price': 21.09},
{'name': 'HPQ', 'shares': , 'price': 31.75},
{'name': 'YHOO', 'shares': , 'price': 16.35},
{'name': 'ACME', 'shares': , 'price': 115.65}
]
cheap = heapq.nsmallest(2, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(2, portfolio, key=lambda s: s['price'])
上面代码在对每个元素进行对比的时候,会以 price 的值进行比较,,如下
>>> expensive
[{'name': 'AAPL', 'shares': , 'price': 543.22}, {'name': 'ACME', 'shares': , 'price': 115.65}]
4. nlargest(), max()以及排序切片的使用场景
1) 当要查找的元素个数相对比较小的时候,函数 nlargest() 和 nsmallest() 是很合适的。
2) 如果你仅仅想查找唯一的最小或最大 (N=1) 的元素的话,那么使用 min() 和max() 函数会更快些。
3) 如果 N 的大小和集合大小接近的时候,通常先排序这个集合然后再使用切片操作会更快点 ( sorted(items)[:N] 或者是 sorted(items)[-N:] )。
5. 使用heapq写一个优先级队列类,并且在这个队列上每次用pop操作都返回一个最高优先级的元素
先写一个PriorityQueue类
import heapq
class PriorityQueue:
def __init__(self):
self._queue = []
self._index =
def push(self, item, priority):
heapq.heappush(self._queue, (-priority, self._index, item)) #把第2个参数的元组加入到self._queue列表中,做为一个列表元素
self._index +=
def pop(self):
return heapq.heappop(self._queue)[-] #返回-prioriry最小的元组,比如(-7, 3, 'jack'), 然后输出这个元组的最后一个元素。
使用上面PriortyQueeu类的例子1
>>> class Item:
... def __init__(self, name):
... self.name = name
... def __repr__(self):
... return 'Item({!r})'.format(self.name) # '!r' 用于在format函数中,表示应用repr函数表示。
...
>>> Item('foo')
Item('foo')
>>> q = PriorityQueue()
>>> q.push(Item('foo'), ) # 这里的Item('foo')安全可以直接用'foo'来代替,这里只是学习下类以及__repr__()的用法
>>> q.push(Item('bar'), )
>>> q.push(Item('spam'), )
>>> q.push(Item('grok'), )
>>> q.pop()
Item('bar')
>>> q.pop()
Item('spam')
>>> q.pop()
Item('foo')
>>> q.pop()
Item('grok')
说明:
1. 函数__repr__()是用于显示的,如果不定义这个函数,Item('foo')的返回结果类似<__main__.Item object at 0x7fa8e0edceb8>
2. 如果两个有着相同优先级的元素 ( foo 和 grok ),pop 操作按照它们被插入到队列的顺序返回的。
原因是我们在元组中定义了一个self._index变量,当优先级相同时,就比较索引值,小的索引值放在队列前面;当优先级不同时,索引值就不需要比较了。
如果不定义索引值,当两个元素的优先级相同时,就会报错。
一个简化的完整例子2
import heapq
class PriorityQueue:
def __init__(self):
self._queue = []
self._index =
def push(self, item, priority):
heapq.heappush(self._queue, (-priority, self._index, item))
self._index +=
def pop(self):
return heapq.heappop(self._queue)[-]
x = PriorityQueue()
x.push('jack', )
x.push('hong', )
x.push('jin', )
x.push('winnie', )
y = x.pop()
print(y)
输出hong
使用deque模块固定队列长度,用headq模块来查找最大或最小的N个元素以及实现一个优先级排序的队列的更多相关文章
- python3-开发进阶 heapq模块(如何查找最大或最小的N个元素)
一.怎样从一个集合中获得最大或者最小的 N 个元素列表? heapq 模块有两个函数:nlargest() 和 nsmallest() 可以完美解决这个问题. import heapq nums = ...
- re模块,正则表达式起别名和分组机制,collections模块,time与datetime模块,random模块
re模块和正则表达式别名和分组机制 命名分组 (1)分组--可以让我们从文本内容中提取指定模式的部分内容,用()来表示要提取的分组,需要注意的是分组 是在整个文本符合指定的正则表达式前提下进行的进一步 ...
- Python【第五篇】模块、包、常用模块
一.模块(Module) 在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护. 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文 ...
- 【笔记】Python基础六:模块module介绍及常用模块
一,module模块和包的介绍 1,在Python中,一个.py文件就称之为一个模块(Module). 2,使用模块的好处? 最大的好处是大大提高了代码的可维护性 其次,编写代码不必从零开始,我们编写 ...
- python 全栈开发,Day25(复习,序列化模块json,pickle,shelve,hashlib模块)
一.复习 反射 必须会 必须能看懂 必须知道在哪儿用 hasattr getattr setattr delattr内置方法 必须能看懂 能用尽量用__len__ len(obj)的结果依赖于obj. ...
- Py修行路 python基础 (二十)模块 time模块,random模块,hashlib模块,OS及sys模块
一.前提介绍: 可以开辟作用域的只有类,函数,和模块 for循环 if,else: 不能开辟自己的作用域 避免程序复用和重复调用,将这些写到一个.py文件中,做成一个模块,进行调 ...
- 第十八篇 模块与包--time&random模块&模块导入import(os.path.dirname(os.path.abspath(__file__)))
模块 在Python中, 一个.py文件就称为一个模块. 使用模块的好处: 1. 最大的好处就是大大提高了代码的可维护性 2. 编写代码不必从零开始.一个模块编写完毕,就可以被其他地方引用.在写其他程 ...
- Python基础(11)_python模块之time模块、rando模块、hashlib、os模块
一.模块 1.什么是模块:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀 模块的本质:模块的本质是一个py文件 2.模块分为三类:1)内置模块:2)第三方模块: ...
- Day 16 : Python 时间模块[time,]datetime[]及第三方模块的下载与安装
在进行python程序开发时,除了可以使用python内置的标准模块外,还右许多第三方模块使用,可以在python官网找到. 在使用第三方模块时,需要下载并安装此模块,然后就可以使用标准模块一样导入并 ...
随机推荐
- 126. Word Ladder II( Queue; BFS)
Given two words (beginWord and endWord), and a dictionary's word list, find all shortest transformat ...
- SpringMVC学习总结(一)--Hello World入门
一.什么是Spring MVC Spring MVC属于SpringFrameWork的后续产品,已经融合在Spring Web Flow里面.Spring 框架提供了构建 Web 应用程序的全功能 ...
- 怎样在Windows与Centos下的Linux间共享文件,如果mnt文件夹不显示,可能是mnt缺少共享支持
mnt中的hgfs文件夹就是Linux系统中挂载共享文件的默认文件夹.有的人按步骤共享之后mnt中没有出现共享的文件,可能是因为你的mnt缺少共享支持. 此时可以在Terminal中输入:sudo m ...
- <!DOCTYPE html>的重要性!
噩梦开始的源头:之前写html或者jsp页面,从来不注意doctype的声明,也不太明白doctype的作用. 直到最近碰到了一个非常奇葩的bug:某一个页面在IE7和8,Chrome,ff等下正常, ...
- Resolving multicopy duplications de novo using polyploid phasing 用多倍体相位法解决多拷贝复制的新问题
抽象.虽然单分子测序系统的兴起已经实现组装复杂地区的能力空前提高在基因组中,基因组中的长节段重复仍然是装配中具有挑战性的前沿. 分段重复同时具有丰富的基因并且倾向于大的结构重排,使得它们的序列的分辨率 ...
- 如何把App放在服务器上供用户下载
如何把App放在服务器上供用户下载 有时候做了个简单的App想把App给朋友帮忙测试一下,却发现上传到各种平台很麻烦,肿么办?难道一个个拷贝,那也太low啦,不是咱程序员该干的事儿,好的话不多说,开搞 ...
- redis centos 上以 tar.gz 安装redis
1.下载安装文件#wget http://download.redis.io/releases/redis-3.2.3.tar.gz 2.删除文件 rm -rf /usr/local/redisrm ...
- Linux安装服务器
[实验:按照下述要求安装一台Server] /boot 100M / 10G /data 50G /var/ftp LVM 6G :/dev/vg_ftp/lv_ftp swap 2048M 主机名: ...
- C++创建自己的库文件(dll文件创建和编译)
创建编译库文件有个好处就是不容易被修改,加密的,方便调用,但是缺点是不容易查看其中的内容,反编译比较麻烦.下面让我们使用VC创建编译自己的库文件吧.常用的函数,不常更改的,应该放到库文件里,所以库文件 ...
- Centos 7 安装 mysql5.7
1.需要下载mysql 下载地址:http://dev.mysql.com/downloads/mysql/ 2.将下载的rpm包上传到centos 7上(我是放在根下面的opt目录) 3. 安装my ...