哈喽大家好,我是咸鱼

我们经常听到 “Python 太慢了”,“Python 性能不行”这样的观点。但是,只要掌握一些编程技巧,就能大幅提升 Python 的运行速度。

今天就让我们一起来看下让 Python 性能更高的 9 个小技巧

原文链接:

https://medium.com/techtofreedom/9-fabulous-python-tricks-that-make-your-code-more-elegant-bf01a6294908

字符串拼接的技巧

如果有大量字符串等待处理,字符串连接将成为 Python 的瓶颈。

一般来讲,Python 中有两种字符串拼接方式:

  • 使用该 join() 函数将字符串列表合并为一个字符串
  • 使用 + or += 符号将每个字符串加成一个

那么哪种方式更快呢?我们一起来看一下

mylist = ["Yang", "Zhou", "is", "writing"]

# Using '+'
def concat_plus():
result = ""
for word in mylist:
result += word + " "
return result # Using 'join()'
def concat_join():
return " ".join(mylist) # Directly concatenation without the list
def concat_directly():
return "Yang" + "Zhou" + "is" + "writing"
import timeit

print(timeit.timeit(concat_plus, number=10000))
# 0.002738415962085128
print(timeit.timeit(concat_join, number=10000))
# 0.0008482920238748193
print(timeit.timeit(concat_directly, number=10000))
# 0.00021425005979835987

如上所示,对于拼接字符串列表, join() 方法比在 for 循环中逐个添加字符串更快。

原因很简单。一方面,字符串是 Python 中的不可变数据,每个 += 操作都会导致创建一个新字符串并复制旧字符串,这会导致非常大的开销。

另一方面,.join() 方法是专门为连接字符串序列而优化的。它预先计算结果字符串的大小,然后一次性构建它。因此,它避免了与循环中 += 操作相关的开销,因此速度更快。

但是,我们发现最快其实是直接用 + 拼接字符串,这是因为:

  • Python 解释器可以在编译时优化字符串的连接,将它们转换为单个字符串。因为没有循环迭代或函数调用,所以它是一个非常高效的操作。
  • 由于所有字符串在编译时都是已知的,因此 Python 可以非常快速地执行此操作,比循环中的运行时连接甚至优化 .join() 方法快得多。

总之,如果需要拼接字符串列表,请选择 join() ;如果直接拼接字符串,只需使用 + 即可。

创建列表的技巧

Python 中创建列表的两种常见方法是:

  • 使用函数 list()
  • [] 直接使用

我们来看下这两种方法的性能

import timeit

print(timeit.timeit('[]', number=10 ** 7))
# 0.1368238340364769
print(timeit.timeit(list, number=10 ** 7))
# 0.2958830420393497

结果表明,执行 list() 函数比直接使用 [] 要慢。

这是因为 是 [] 字面语法( literal syntax ),而 list() 是构造函数调用。毫无疑问,调用函数需要额外的时间。

同理,在创建字典时,我们也应该利用 {} 而不是 dict()

成员关系测试的技巧

成员关系测试的性能很大程度上取决于底层数据结构

import timeit

large_dataset = range(100000)
search_element = 2077 large_list = list(large_dataset)
large_set = set(large_dataset) def list_membership_test():
return search_element in large_list def set_membership_test():
return search_element in large_set print(timeit.timeit(list_membership_test, number=1000))
# 0.01112208398990333
print(timeit.timeit(set_membership_test, number=1000))
# 3.27499583363533e-05

如上面的代码所示,集合中的成员关系测试比列表中的成员关系测试要快得多。

这是为什么呢?

  • 在 Python 列表中,成员关系测试 ( element in list ) 是通过遍历每个元素来完成的,直到找到所需的元素或到达列表的末尾。因此,此操作的时间复杂度为 O(n)。
  • Python 中的集合是作为哈希表实现的。在检查成员资格 ( element in set ) 时,Python 使用哈希机制,其时间复杂度平均为 O(1)。

这里的技巧重点是在编写程序时仔细考虑底层数据结构。利用正确的数据结构可以显著加快我们的代码速度。

使用推导式而不是 for 循环

Python 中有四种类型的推导式:列表、字典、集合和生成器。它们不仅为创建相对数据结构提供了更简洁的语法,而且比使用 for 循环具有更好的性能。

因为它们在 Python 的 C 实现中进行了优化。

import timeit

def generate_squares_for_loop():
squares = []
for i in range(1000):
squares.append(i * i)
return squares def generate_squares_comprehension():
return [i * i for i in range(1000)] print(timeit.timeit(generate_squares_for_loop, number=10000))
# 0.2797503340989351
print(timeit.timeit(generate_squares_comprehension, number=10000))
# 0.2364629579242319

上面的代码是列表推导式和 for 循环之间的简单速度比较。如结果所示,列表推导式速度更快。

访问局部变量速度更快

在 Python 中,访问局部变量比访问全局变量或对象的属性更快。

import timeit

class Example:
def __init__(self):
self.value = 0 obj = Example() def test_dot_notation():
for _ in range(1000):
obj.value += 1 def test_local_variable():
value = obj.value
for _ in range(1000):
value += 1
obj.value = value print(timeit.timeit(test_dot_notation, number=1000))
# 0.036605041939765215
print(timeit.timeit(test_local_variable, number=1000))
# 0.024470250005833805

原理也很简单:当编译一个函数时,它内部的局部变量是已知的,但其他外部变量需要时间来检索。

优先考虑内置模块和库

当我们讨论 Python 的时候,通常指的是 CPython,因为 CPython 是 Python 语言的默认和使用最广泛的实现。

考虑到它的大多数内置模块和库都是用C语言编写的,C语言是一种更快、更低级的语言,我们应该利用它的内置库,避免重复造轮子。

import timeit
import random
from collections import Counter def count_frequency_custom(lst):
frequency = {}
for item in lst:
if item in frequency:
frequency[item] += 1
else:
frequency[item] = 1
return frequency def count_frequency_builtin(lst):
return Counter(lst) large_list = [random.randint(0, 100) for _ in range(1000)] print(timeit.timeit(lambda: count_frequency_custom(large_list), number=100))
# 0.005160166998393834
print(timeit.timeit(lambda: count_frequency_builtin(large_list), number=100))
# 0.002444291952997446

上面的程序比较了计算列表中元素频率的两种方法。正如我们所看到的,利用 collections 模块的内置计数器比我们自己编写 for 循环更快、更简洁、更好。

使用缓存装饰器

缓存是避免重复计算和提高程序速度的常用技术。

幸运的是,在大多数情况下,我们不需要编写自己的缓存处理代码,因为 Python 提供了一个开箱即用的装饰器 — @functools.cache

例如,以下代码将执行两个斐波那契数生成函数,一个具有缓存装饰器,但另一个没有:

import timeit
import functools def fibonacci(n):
if n in (0, 1):
return n
return fibonacci(n - 1) + fibonacci(n - 2) @functools.cache
def fibonacci_cached(n):
if n in (0, 1):
return n
return fibonacci_cached(n - 1) + fibonacci_cached(n - 2) # Test the execution time of each function
print(timeit.timeit(lambda: fibonacci(30), number=1))
# 0.09499712497927248
print(timeit.timeit(lambda: fibonacci_cached(30), number=1))
# 6.458023563027382e-06

可以看到 functools.cache 装饰器如何使我们的代码运行得更快。

缓存版本的速度明显更快,因为它缓存了先前计算的结果。因此,它只计算每个斐波那契数一次,并从缓存中检索具有相同参数的后续调用

while 1 VS while True

如果要创建无限 while 循环,我们可以使用 while True or while 1 .

它们的性能差异通常可以忽略不计。但有趣的是, while 1 稍微快一点。

这是因为是 1 字面量,但 True 是一个全局名称,需要在 Python 的全局作用域中查找。所以 1 的开销很小。

import timeit

def loop_with_true():
i = 0
while True:
if i >= 1000:
break
i += 1 def loop_with_one():
i = 0
while 1:
if i >= 1000:
break
i += 1 print(timeit.timeit(loop_with_true, number=10000))
# 0.1733035419601947
print(timeit.timeit(loop_with_one, number=10000))
# 0.16412191605195403

正如我们所看到的,确实 while 1 稍微快一些。

然而,现代 Python 解释器(如 CPython )是高度优化的,这种差异通常是微不足道的。所以我们不需要担心这个可以忽略不计的差异。更不用说 while Truewhile 1 可读性更好。

按需导入 Python 模块

在 Python 脚本开头导入所有模块似乎是每个人都会这么做的操作,事实上我们没有必要导入全部的模块。如果模块太大,则根据需要导入它是一个更好的主意。

def my_function():
import heavy_module
# rest of the function

如上面的代码所示,heavy_module 在函数中导入。这是一种“延迟加载”的思想:只有 my_function 被调用的时候该模块才会被导入。

这种方法的好处是,如果 my_function 在脚本执行期间从未调用过,则 heavy_module 永远不会加载,从而节省资源并减少脚本的启动时间。

9 个让你的 Python 代码更快的小技巧的更多相关文章

  1. 让Python代码更快运行的 5 种方法

    不论什么语言,我们都需要注意性能优化问题,提高执行效率.选择了脚本语言就要忍受其速度,这句话在某种程度上说明了Python作为脚本语言的不足之处,那就是执行效率和性能不够亮.尽管Python从未如C和 ...

  2. 教你一招,提升你Python代码的可读性,小技巧

    Python的初学者,开发者都应该知道的代码可读性提高技巧,本篇主要介绍了如下内容: PEP 8是什么以及它存在的原因 为什么你应该编写符合PEP 8标准的代码 如何编写符合PEP 8的代码 为什么我 ...

  3. 让你的python代码优雅地道的小技巧

    转载地址:http://www.lightxue.com/transforming-code-into-beautiful-idiomatic-python 用了python这么久,逐渐才了解到pyt ...

  4. 可爱的豆子——使用Beans思想让Python代码更易维护

    title: 可爱的豆子--使用Beans思想让Python代码更易维护 toc: false comments: true date: 2016-06-19 21:43:33 tags: [Pyth ...

  5. 让 Python 代码更易维护的七种武器——代码风格(pylint、Flake8、Isort、Autopep8、Yapf、Black)测试覆盖率(Coverage)CI(JK)

    让 Python 代码更易维护的七种武器 2018/09/29 · 基础知识 · 武器 原文出处: Jeff Triplett   译文出处:linux中国-Hank Chow    检查你的代码的质 ...

  6. How Javascript works (Javascript工作原理) (二) 引擎,运行时,如何在 V8 引擎中书写最优代码的 5 条小技巧

    个人总结: 一个Javascript引擎由一个标准解释程序,或者即时编译器来实现. 解释器(Interpreter): 解释一行,执行一行. 编译器(Compiler): 全部编译成机器码,统一执行. ...

  7. pythonic-让python代码更高效

    何为pythonic? pythonic如果翻译成中文的话就是很python.很+名词结构的用法在中国不少,比如:很娘,很国足,很CCTV等等. 我的理解为,很+名词表达了一种特殊和强调的意味.所以很 ...

  8. 程序员需要掌握的七种 Python 代码更易维护的武器

    检查你的代码风格 PEP 8 是 Python 代码风格规范,它规定了类似行长度.缩进.多行表达式.变量命名约定等内容.尽管你的团队自身可能也会有稍微不同于 PEP 8 的代码风格规范,但任何代码风格 ...

  9. 小白突破百度翻译反爬机制,33行Python代码实现汉译英小工具!

    表弟17岁就没读书了,在我家呆了差不多一年吧. 呆的前几个月,每天上网打游戏,我又不好怎么在言语上管教他,就琢磨着看他要不要跟我学习Python编程.他开始问我Python编程什么?我打开了我给学生上 ...

  10. Python代码块缓存、小数据池

    引子 前几天遇到了这样一道Python题目:a='123',b='123',下列哪个是正确的? A. a != b B. a is b C. a==123 D. a + b =246 正确答案是B 是 ...

随机推荐

  1. day02 数据类型转换 运算符 方法

    数据类型转换 自动类型转换 强制类型转换 1. 自动类型转换:就是范围小的向范围大的转换  将取值范围小刀的类型自动提升为取值范围大的类型. 转换规则  byte.short.char  int--- ...

  2. 用策略模式干掉代码里大量的if-eles或则Swatch,提升B格由面向过程转为面向对象

    现象 大量的分支选择型代码段看着让人头疼 for (Field field : declaredFields) { Class<?> type = field.getType(); Str ...

  3. 其它——python操作kafka实践

    文章目录 1.先看最简单的场景,生产者生产消息,消费者接收消息,下面是生产者的简单代码. ------------------------------------------------------- ...

  4. 快速掌握keepalived

    转载请注明出处: Keepalived是一个基于VRRP(虚拟路由冗余协议)的开源软件,用于在Linux系统上实现高可用性和负载均衡.它的主要功能是通过多台服务器之间的协作,确保在其中一台服务器发生故 ...

  5. 基于matomo实现业务数据埋点采集上报

    matomo是一款Google-analytics数据埋点采集上报的平替方案,可保护您的数据和客户的隐私:正如它官网的slogan: Google Analytics alternative that ...

  6. Dubbo 路由及负载均衡性能优化

    作者:vivo 互联网中间件团队- Wang Xiaochuang 本文主要介绍在vivo内部针对Dubbo路由模块及负载均衡的一些优化手段,主要是异步化+缓存,可减少在RPC调用过程中路由及负载均衡 ...

  7. CF1295D Same GCDs

    前置知识: 辗转相除法 欧拉函数 首先,根据辗转相除法求 \(\gcd\) 的公式,可得 \(\gcd(a+x,m)=\gcd((a+x)\mod m,m)\). 则题目可以转化为:求有多少 \(x\ ...

  8. C#版字节跳动SDK - SKIT.FlurlHttpClient.ByteDance

    前言 在我们日常开发工作中对接第三方开放平台,找一款封装完善且全面的SDK能够大大的简化我们的开发难度和提高工作效率.今天给大家推荐一款C#开源.功能完善的字节跳动SDK:SKIT.FlurlHttp ...

  9. 实用的命令行终端增强软件:Tabby

    还是那句话:出众的软件有很多,适合自己的才是最好的. 一.软件介绍 Tabby是一个开源免费软件,支持Windows.macOS和Linux系统.它提供了一个高度可定制的终端界面,可以通过多种方式添加 ...

  10. Django admin 注册自己的路由

    通过 admin.py 在 Django 后台注册自己的路由(对应自己的视图) 要在一个 app 里面的 admin.py 添加如下代码 # django2\apps\business\admin.p ...