Python Cookbook 数据结构和算法

1.查找最大或最小的N个元素

import heapq

nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]

print(heapq.nlargest(3, nums)) # Prints [42, 37, 23]

print(heapq.nsmallest(3, nums)) # Prints [-4, 1, 2]

# 可以接受关键字参数,用于更复杂的数据结构

portfolio = [

    {'name': 'IBM', 'shares': 100, 'price': 91.1},

    {'name': 'AAPL', 'shares': 50, 'price': 543.22},

    {'name': 'FB', 'shares': 200, 'price': 21.09},

    {'name': 'HPQ', 'shares': 35, 'price': 31.75},

    {'name': 'YHOO', 'shares': 45, 'price': 16.35},

    {'name': 'ACME', 'shares': 75, 'price': 115.65}

]

cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])

expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price'])

讨论, 堆数据结构里heap[0]永远是最小的元素,剩余最小的通过heapq.heappop()得到,时间复杂度是O(log N).查找最小的三个可以写成

heapq.heappop(heap)

heapq.heappop(heap)

heapq.heappop(heap)

==>当查找的元素个数相对比较小的时候,nlargest()和nsmallest比较合适.

==>仅查找最大值或最小值, min()和max()函数会更快

==>如果查找的数量跟集合本身差不多大,应该先排序,再使用切片操作sorted(items)[:N]和sorted(items)[-N:]

2.元祖是可以比较大小的

a = (1, 2, 'dandy')

b = (10, 4, 'sam')

c = (1, 3, 'tom')

d = (1, 2, 'dandy1')

print(a < b)  # True

print(a < c)  # True

print(a < d)  # True

元祖会按照第一个元素,第二个元素的顺序进行比较大小.

那列表呢?

a = [1, 2]

b = [1, 3]

c = [2, 3]

print(a < b)  # True

print(a < c)  # True

元祖的混合数据比较呢?

class Foo:

    def __init__(self, a):

        self.a = a

a = (1, 2, [3, 4])

b = (1, 2, [4, 5])

c = (1, Foo(1))

print(a > b)   # False

print(a > c)


Traceback (most recent call last):

  File "/home/dandy/Documents/charm/cookbook/1算法和数据结构/13test.py", line 32, in <module>

    print(a > c)

TypeError: '>' not supported between instances of 'int' and 'Foo'

上面的扩展跳跃性有点强,直接从常用的数据结构扩展到了对象的比较.可以发现报错了,报错内容为Foo类没有实现比较运算符.在一个类内,比较运算符的实现是依赖__lt__, __eq__, __gt__这三个内置函数的,分别对应'<', '==', '>'.在上面的比较内

1.解析a > c

2.比较a和c的第一个元素,a[0] > c[0], 结果是相等,跳到下一个元素

3.比较a和c的第二个元素,a[1] > c[1],此时c[1]是一个实例,以c[1]为中心的话,可以看做foo(1) < a[1],Foo没有实现__lt__这个内置方法.

大结局:只要对象实现上述的三种比较方法__lt__, __eq__, __gt__就可以进行比较大小了,python的对象确实也是这么做的. 很多都是c实现的,__lt__, __eq__, __gt__相当于留给开发人员的外部接口,可以重写或者定义其内置方法.

class Foo:

    def __init__(self, a):

        self.a = a

    def __lt__(self, other):

        return self.a > other

a = (1, 2, [3, 4])

b = (1, 2, [4, 5])

c = (1, Foo(1))

print(a > b)  # False

print(a > c)  # False

3.字典的默认值

# pairs是一组新增数据,需要按照key,加入到字典d对应的字段的列表内

pairs = {'a': 1, 'b': 2, 'c': 3}

d = {}

for key, value in pairs:

    if key not in d:

        d[key] = []

    d[key].append(value)

可以用字典的setdefault方法来解决:

pairs = {'a': 1, 'b': 2, 'c': 3}

d = {}

for key, value in pairs:

    d.setdefault(key, []).append(value)

这样就会方便很多,但还是有点别扭,因为每次调用都要创建一个新的初始值的实例.引入内置的defaultdict,在字典对象申明的时候直接定义好value的对象

d = defaultdict(list)

for key, value in pairs:

    d[key].append(value)

4.字典比较大小

prices = {

    'ACME': 45.23,

    'AAPL': 612.78,

    'IBM': 205.55,

    'HPQ': 37.20,

    'FB': 10.75

}

比较大小,输出键值

min_price = min(zip(prices.values(), prices.keys()))

# min_price is (10.75, 'FB')

max_price = max(zip(prices.values(), prices.keys()))

# max_price is (612.78, 'AAPL')

排序输出

prices_sorted = sorted(zip(prices.values(), prices.keys()))

# prices_sorted is [(10.75, 'FB'), (37.2, 'HPQ'),

#                   (45.23, 'ACME'), (205.55, 'IBM'),

#                   (612.78, 'AAPL')]

讨论通常的做法

min(prices.values()) # Returns 10.75

max(prices.values()) # Returns 612.78

min(prices, key=lambda k: prices[k]) # Returns 'FB'

max(prices, key=lambda k: prices[k]) # Returns 'AAPL'

# 上面的方式不能输出完整的键值对

min_value = prices[min(prices, key=lambda k: prices[k])]

# 需要进行2次查找操作,时间复杂度高

Python Cookbook 数据结构和算法的更多相关文章

[0x00 用Python讲解数据结构与算法] 概览
自从工作后就没什么时间更新博客了,最近抽空学了点Python,觉得Python真的是很强大呀.想来在大学中没有学好数据结构和算法,自己的意志力一直不够坚定,这次想好好看一本书,认真把基本的数据结构和算 ...
《用Python解决数据结构与算法问题》在线阅读
源于经典数据结构作为计算机从业人员的必备基础,Java, c 之类的语言有很多这方面的书籍,Python 相对较少, 其中比较著名的一本 problem-solving-with-algorithm ...
Python(一)数据结构和算法的20个练习题问答
数据结构和算法 Python 提供了大量的内置数据结构,包括列表,集合以及字典.大多数情况下使用这些数据结构是很简单的. 但是,我们也会经常碰到到诸如查询,排序和过滤等等这些普遍存在的问题. 因此,这 ...
[0x01 用Python讲解数据结构与算法] 关于数据结构和算法还有编程
忍耐和坚持虽是痛苦的事情,但却能渐渐地为你带来好处. ——奥维德一.学习目标 · 回顾在计算机科学.编程和问题解决过程中的基本知识: · 理解“抽象”在问题解决过程中的重要作用: · 理解并实现抽象 ...
python cookbook 数据结构
保留最后n个元素: from collections import deque def search (lines, pattern, history=): previous_lines = dequ ...
用python语言讲解数据结构与算法
写在前面的话:关于数据结构与算法讲解的书籍很多,但是用python语言去实现的不是很多,最近有幸看到一本这样的书籍,由Brad Miller and David Ranum编写的<Problem ...
python数据结构与算法
最近忙着准备各种笔试的东西,主要看什么数据结构啊,算法啦,balahbalah啊,以前一直就没看过这些,就挑了本简单的<啊哈算法>入门,不过里面的数据结构和算法都是用C语言写的,而自己对p ...
Python数据结构与算法--List和Dictionaries
Lists 当实现 list 的数据结构的时候Python 的设计者有很多的选择. 每一个选择都有可能影响着 list 操作执行的快慢. 当然他们也试图优化一些不常见的操作. 但是当权衡的时候,它们还 ...
Python数据结构与算法--算法分析
在计算机科学中,算法分析(Analysis of algorithm)是分析执行一个给定算法需要消耗的计算资源数量(例如计算时间,存储器使用等)的过程.算法的效率或复杂度在理论上表示为一个函数.其定义 ...

随机推荐

12 Django Rest Swagger生成api文档
01-简介 Swagger:是一个规范和完整的框架,用于生成.描述.调用和可视化RESTful风格的Web服务.总体目标是使客户端和文件系统源代码作为服务器以同样的速度来更新.当接口有变动时,对应的接 ...
GUI编程实战
1.拆分窗格:JSplistPane package swing; /** * swing 实战 */ import java.awt.*; import javax.swing.*; public ...
deeplearing4j学习以及踩过的坑
1. 添加dl4j后, run项目时, 一直run不起来, run按钮绿色但是点击没反应. 查看日志后发现: 是classpath太长导致的. 在本项目的.idea文件夹,找到文件夹中的works ...
win 执行puppet
C:\scripts\win_exec_proxy.bat \\adsoft.base-fx.com\puppet\puppet\files\Windows_10_x64\C\user\logon\ ...
CSS高度塌陷问题与解决办法
问题描述: 在文档流中,父元素默认被子元素撑开(父多高子多高),一旦子浮动,脱离文档流,父无撑起元素便塌陷,父下的所有元素会上移. (不推荐)可以将父高度写死避免塌陷,但高度写死后,父高度不能自动适应 ...
Maven常用命令汇总
1.单独构建多模块项目中的某个模块 mvn clean package -pl 模块名 2.跳过测试代码直接打包 mvn install -DskipTests
Python——模块——fnmatch（文件名对比）
一.模块作用 fnmatch 模块主要用于文件名的比较,使用 Unix shell 使用的 glob 样式模式. 二.简单匹配 fnmatch() 将单个文件名与模式进行比较并返回布尔值,来看它们是否 ...
spring整合junit进行测试
以下只是一个模板,大家记得改变配置文件 package cn.itcast.crm.dao; import org.junit.Test; import org.junit.runner.RunWit ...
Msi中文件替换
转自https://blog.csdn.net/davidhsing/article/details/9962377 ※说明:目前可以用于MSI编辑的软件很多,但是有些软件在保存时会在MSI文件中写入 ...
js 替换所有指定的字符串
js 的replace方法只替换第一个匹配到的的字符如果要全局替换,使用以下方法(g为全局标志) str.replace(/需要替换的字符串/g,"新字符串") //如果有特殊符 ...

Python Cookbook 数据结构和算法

Python Cookbook 数据结构和算法的更多相关文章

随机推荐

热门专题