Python 的多线程是鸡肋?

“唉,还没毕业就受到甲方的支配,等以后进了公司可咋整啊。”小白嘴里这么吐槽,但心理上还是不敢怠慢,只能恋恋不舍地关掉眼前的游戏,打开了 Python 代码思考了起来。
“现在的程序是单线程的,那就用多线程模型来优化吧,嘿嘿,我太机智了!”小白打心底感谢前段时间里学习到的线程的知识。“Python 里好像是 threading 模块负责多线程的,就决定是你了,threading !”
花了两三个小时,小白终于把程序改好了,他长舒一口气,点击 Run ,开始测试运行时间。
“woc!怎么运行时间还变长了?”看着屏幕上显示的测试结果,小白傻眼了,这多线程怎么不顶用?自己明明是按官方文档来的啊!
debug 无果,小白只好寻求好朋友小明的帮助。
“哈哈哈,你居然用 python 的多线程?你不知道 python 的多线程被很多人称作「鸡肋」吗?”
“啊,不会吧?还有这种说法?我要是知道我肯定就不用多线程来改了。。。可为什么 python 的多线程就鸡肋了?那多线程爬虫是怎么回事?”
“我先给你解释下 python 下的多线程是怎么一回事吧。Python 是一门解释型语言,它的执行是由解释器来控制的,我们一般都会使用默认的 Cpython 解释器,这些我想你应该清楚。”
“那当然,这在一开始学 Python 的时候老师就讲过了。”
“那你知不知道什么是 GIL?”小明问道。
小白挠挠头,尴尬的回答:“我没听说过。”
“也是,你要是知道 GIL ,就能弄明白 Python 的多线程了。GIL,全称是 Global Interpreter Lock ,全局解释锁 ,专门给解释器用的。”
“蛤?解释器还要需要锁? ”
“这个锁别有妙用,让我先考考你,C 语言能不能在用户态下做到线程级别的时间片轮转?”
“不能!操作系统里讲过了,我还记得上次你教我的内容~”小白得意的回答。
关于线程,详细的在这里:
“但是 python 能做到!python 里,解释器可以记录每一个线程执行了多长时间——时间一到,就能够切换到另一条线程。”
“有点意思,听起来像是解释器充当了操作系统的角色,然后为 python 线程提供了时间片轮转的能力。”
tobe 注:理论上 C 语言也可以做到,毕竟 python 解释器就是用 C 语言写的。
“解释的很到位,我再说回 GIL 吧,在多核还没有出现的时候,就已经有线程的存在了,GIL 就是拿来给线程加锁的,当一个线程将要执行时,解释器会把 GIL 锁给这个线程,其他线程因为没有锁,是无法运行的。等到持有锁线程阻塞或者运行 100 个字节码,解释器就会把锁交给其他线程。”

“但是这个 GIL 锁是全局(Global)的,也就导致即使是多核情况下,一次也只有一个线程能运行,从整体上看,整个程序是串行的。”
小白恍然大悟:“怪不得我的程序还变慢了,原来 python 的多线程不仅不能利用多核,还因为线程切换拖慢了我程序的执行速度!我想很多人应该都遇到过我这个问题吧,Python 社区为什么不修改这一特性,让多线程也做到并行呢?”
小明叹了口气:“哪有这么简单,修改锁的设计是很难的,我听说 MYSQL 拆分 buffer pool mutex 这个全局锁花了好多年呢。不过 Python 社区为此还是做了不少挽救工作的,比如在线程睡觉(sleep),等待连接的时候主动释放 GIL,让其他线程继续执行。拿爬虫程序来说吧,单个爬虫总会花时间在下载网页上,很多 CPU 时间就浪费掉了, 提供 sleep 机制后,这些爬虫可以在等待下载时释放 GIL 锁,把机会让给其他爬虫,这样整体运行速度能够得到大幅提升。”
“我好像明白了,”小白感觉自己被打通了任督二脉:“也就是说 Python 的多线程适合 I/O 密集型的程序,但是对计算密集型程序就不那么友好了~ 诶等等,那我怎么办?我还打算用多线程优化我的程序呢!”
“让 python 利用多核的方法还是有的,比如说,让 python 调用 C 语言的代码,在 C 语言里实现多线程,因为 C 语言里没有 GIL 锁,这些线程不会受到 GIL 的约束,也就能并行了。”

小白一个劲儿摇头:“不不不不不,好不容易写完的 Python 代码,你让我改成 C?这不是要我的命吗!我拒绝!”
“这不是还有第二种方法嘛——使用多进程,Python 里有个 multiprocessing 模块,可以创建多个进程,因为不同的进程使用不同的解释器,所以它们有各自的 GIL,互不干扰,自然就能完成并发了。“
“这个方法听起来才正常嘛,我马上就回去试试,谢谢你了!”
希望你在看完我的文章之后有所收获~(求点赞呐!)
Python 的多线程是鸡肋?的更多相关文章
- Python多进程和多线程是鸡肋嘛?【转】
GIL是什么 Python的代码执行由 Python虚拟机(也叫解释器主循环,CPython版本)来控制,Python在设计之初就考虑到在解释器的主循环中,同时只有一个线程在运行.即每个CPU在任意时 ...
- Python的多线程和多进程
(1)多线程的产生并不是因为发明了多核CPU甚至现在有多个CPU+多核的硬件,也不是因为多线程CPU运行效率比单线程高.单从CPU的运行效率上考虑,单任务进程及单线程效率是最高的,因为CPU没有任何进 ...
- python 的多线程执行速度
python 的多线程有点鸡肋,适用场景有局限,单位时间多个核只能跑一个线程. 有泳池一个,四个泵,但只有一个人,一人只能开启管理着其中一个,所以四个泵没什么用.但是,如果泵的工作时间与冷却恢复时间是 ...
- Python中多线程与多进程的恩恩怨怨
概念: 并发:当有多个线程在操作时,如果系统只有一个CPU,则它根本不可能真正同时进行一个以上的线程,它只能把CPU运行时间划分成若干个时间段,再将时间 段分配给各个线程执行,在一个时间段的线程代码运 ...
- [ Python - 11 ] 多线程及GIL全局锁
1. GIL是什么? 首先需要明确的一点是GIL并不是python的特性, 它是在实现python解析器(Cpython)时所引入的一个概念. 而Cpython是大部分环境下默认的python执行环境 ...
- Python的多线程(threading)与多进程(multiprocessing )
进程:程序的一次执行(程序载入内存,系统分配资源运行).每个进程有自己的内存空间,数据栈等,进程之间可以进行通讯,但是不能共享信息. 线程:所有的线程运行在同一个进程中,共享相同的运行环境.每个独立的 ...
- Python GIL 多线程机制 (C source code)
最近阅读<Python源码剖析>对进程线程的封装解释: GIL,Global Interpreter Lock,对于python的多线程机制非常重要,其如何实现的?代码中实现如下: 指向一 ...
- Python实现多线程HTTP下载器
本文将介绍使用Python编写多线程HTTP下载器,并生成.exe可执行文件. 环境:windows/Linux + Python2.7.x 单线程 在介绍多线程之前首先介绍单线程.编写单线程的思路为 ...
- Python实现多线程调用GDAL执行正射校正
python实现多线程参考http://www.runoob.com/python/python-multithreading.html #!/usr/bin/env python # coding: ...
随机推荐
- 微服务SpringCloud之zipkin链路追踪
随着业务发展,系统拆分导致系统调用链路愈发复杂一个前端请求可能最终需要调用很多次后端服务才能完成,当整个请求变慢或不可用时,我们是无法得知该请求是由某个或某些后端服务引起的,这时就需要解决如何快读定位 ...
- 连接电脑时,无法启用USB调试
原因: 手机悬浮球 解决方案: 取消悬浮球,停止一切悬浮应用 (下面的废话可以不听) 预置条件: 手机已经打开开发者模式 开启USB调试模式 电脑能检测到手机 故事背景: 经常用手机连接电脑进行adb ...
- Python中的MRO(方法解析顺序)[转载]
本文转载至: http://hanjianwei.com/2013/07/25/python-mro/ 对于支持继承的编程语言来说,其方法(属性)可能定义在当前类,也可能来自于基类,所以在方法调用时就 ...
- 利用sqlalchemy 查询视图
这个问题 google 百度 中英文搜了一上午.最新的回答还是 7年前.最后自己靠着官方文档的自己改出来一个比较方便的方法 使用环境 python == 3.7.0 SQLAlchemy === 1. ...
- Python基础(十三)
今日主要内容 闭包 装饰器初识 标准装饰器 一.闭包 (一)什么是闭包 闭包:内层函数调用外层函数的变量就是闭包(不能是全局变量) def func1(): a = 10 def func2(): p ...
- 手把手创建gulp
这几天安装gulp踩了不少坑,现在讲解一个入门的案例解析: ==首先大家要确保node.npm.npx.gulp安装是否成功 == 这些安装都是傻瓜式安装,大家可以找到相应的教材. 创建一个自己的文件 ...
- 【ADO.NET基础-Session】Session的基本应用
在服务端存储状态的对象:Session和Application 在客户端存储状态的对象:Cookie 1.Session:每个独立的浏览器都会创建一个独立的Session,不是一台电脑一个Sessio ...
- 分库分表(2) --- ShardingSphere(理论)
ShardingSphere---理论 ShardingSphere在中小企业需要分库分表的时候用的会比较多,因为它维护成本低,不需要额外增派人手;而且目前社区也还一直在开发和维护,还算是比较活跃. ...
- 如何安装PHPstorm并配置php运行环境运行php项
php是程序开发者常用的编程语言,那么它就需要一款简单实用的集成开发环境,也就是一款舒服的编辑器,今天笔者为大家介绍phpstorm这款软件,并详细的讲解如何用它配置php项目 工具/原料 笔 ...
- 前端深入之css篇|link和@import到底有什么区别?
写在前面 在真正的前端开发中,我们很少去写行内样式和内嵌样式,通常都是去引用外部样式. 而在我们学习之初的外部样式表都是用link引入的,但是当后来我们学习的逐渐深入,发现@import也可以引入样式 ...