python单线程，多线程和协程速度对比

在某些应用场景下，想要提高python的并发能力，可以使用多线程，或者协程。比如网络爬虫，数据库操作等一些IO密集型的操作。下面对比python单线程，多线程和协程在网络爬虫场景下的速度。

一，单线程。

　　单线程代

 1 #!/usr/bin/env 
 2 # coding:utf8 
 3 # Author: hz_oracle

 import MySQLdb

 import gevent

 import requests

 import time

 class DbHandler(object):

     def __init__(self, host, port, user, pwd, dbname):

         self.host = host

         self.port = port

         self.user = user

         self.pwd = pwd

         self.db = dbname

     def db_conn(self):

         try:

             self.conn = MySQLdb.connect(host=self.host, port=self.port, user=self.user, passwd=self.pwd, db=self.db, charset="utf8")

             self.cursor = self.conn.cursor()

             return 1

         except Exception as e:

             return 0

     def get_urls(self, limitation):

         sql = """select pic  from  picurltable limit  %s""" % limitation

         urls_list = list()

         try:

             self.cursor.execute(sql)

             fetchresult = self.cursor.fetchall()

             for line in fetchresult:

                 urls_list.append(line[0])

             print len(urls_list)

         except Exception as e:

             print u"数据库查询失败:%s"  % e

             return []

         return urls_list

     def db_close(self):

         self.conn.close()

 def get_pic(url):

     try:

         pic_obj = requests.get(url).content

     except Exception as e:

         print u"图片出错"

         return ""

     filename = url.split('/')[-2]

     file_path = "./picture/" + filename + '.jpg'

     fp = file(file_path, 'wb')

     fp.write(pic_obj)

     fp.close()

     return "ok"

 def main():

     start_time = time.time()

     db_obj = DbHandler(host='127.0.0.1', port=3306, user='root', pwd='123456', dbname='pic')

     db_obj.db_conn()

     url_list = db_obj.get_urls(100)
     map(get_pic, url_list)

     #for url in url_list:

     #    get_pic(url)

     end_time = time.time()

     costtime = float(end_time) - float(start_time)

     print costtime

     print "download END"

 if __name__ == "__main__":

     main()

　　运行结果

100

45.1282339096

download END

单线程情况下，下载100张图片花了45秒。

再来看多线程的情况下。

#!/usr/bin/env python

# coding:utf8

# Author: hz_oracle

import MySQLdb

import gevent

import requests

import time

import threading

import Queue

lock1 = threading.RLock()

url_queue = Queue.Queue()

urls_list = list()

class DbHandler(object):

    def __init__(self, host, port, user, pwd, dbname):

        self.host = host

        self.port = port

        self.user = user

        self.pwd = pwd

        self.db = dbname

    def db_conn(self):

        try:

            self.conn = MySQLdb.connect(host=self.host, port=self.port, user=self.user, passwd=self.pwd, db=self.db, charset="utf8")

            self.cursor = self.conn.cursor()

            return 1

        except Exception as e:

            return 0

    def get_urls(self, limitation):

        sql = """select pic  from  picurltable limit  %s""" % limitation

        try:

            self.cursor.execute(sql)

            fetchresult = self.cursor.fetchall()

            for line in fetchresult:

                url_queue.put(line[0])

        except Exception as e:

            print u"数据库查询失败:%s"  % e

            return 0

        return 1

    def db_close(self):

        self.conn.close()

class MyThread(threading.Thread):

    def __init__(self):

        super(MyThread, self).__init__()

    def run(self):

        url = url_queue.get()

        try:

            pic_obj = requests.get(url).content

        except Exception as e:

            print u"图片出错"

            return ""

        filename = url.split('/')[-2]

        file_path = "./picture/" + filename + '.jpg'

        fp = file(file_path, 'wb')

        fp.write(pic_obj)

        fp.close()

def main():

    start_time = time.time()

    db_obj = DbHandler(host='127.0.0.1', port=3306, user='root', pwd='', dbname='pic')

    db_obj.db_conn()

    db_obj.get_urls(100)

    for i in range(100):

        i = MyThread()

        i.start()

    while True:

        if threading.active_count()<=1:

            break

    end_time = time.time()

    costtime = float(end_time) - float(start_time)

    print costtime

    print "download END"

if __name__ == "__main__":

    main()

运行结果

15.408192873

download END

启用100个线程发现只要花15秒即可完成任务，100个线程可能不是最优的方案，但较单线程有很明显的提升。接着再来看协程。

协程代码

#!/usr/bin/env python

# coding:utf8

# Author: hz_oracle

import MySQLdb

import requests

import time

import threading

import Queue

from gevent import monkey; monkey.patch_all()

import gevent

class DbHandler(object):

    def __init__(self, host, port, user, pwd, dbname):

        self.host = host

        self.port = port

        self.user = user

        self.pwd = pwd

        self.db = dbname

    def db_conn(self):

        try:

            self.conn = MySQLdb.connect(host=self.host, port=self.port, user=self.user, passwd=self.pwd, db=self.db, charset="utf8")

            self.cursor = self.conn.cursor()

            return 1

        except Exception as e:

            return 0

    def get_urls(self, limitation):

        urls_list = list()

        sql = """select pic  from  picurltable limit  %s""" % limitation

        try:

            self.cursor.execute(sql)

            fetchresult = self.cursor.fetchall()

            for line in fetchresult:

                urls_list.append(line[0])

        except Exception as e:

            print u"数据库查询失败:%s"  % e

            return []

        return urls_list

    def db_close(self):

        self.conn.close()

def get_pic(url):

    try:

        pic_obj = requests.get(url).content

    except Exception as e:

        print u"图片出错"

        return ""

    filename = url.split('/')[-2]

    file_path = "./picture/" + filename + '.jpg'

    fp = file(file_path, 'wb')

    fp.write(pic_obj)

    fp.close()

    return "ok"

def main():

    start_time = time.time()

    db_obj = DbHandler(host='127.0.0.1', port=3306, user='root', pwd='123456', dbname='pic')

    db_obj.db_conn()

    url_list = db_obj.get_urls(100)

    gevent.joinall([gevent.spawn(get_pic,url) for url in url_list])

    end_time = time.time()

    costtime = float(end_time) - float(start_time)

    print costtime

    print "download END"

if __name__ == "__main__":

    main()

运行结果

10.6234440804

download END

使用协程发现只花了10秒多，也就是三种方法中最快的。

总结：

三种方法中，单线程最慢，多线程次之，而协程最快。不过如果对多线程进行优化，也可能变快，这里不讨论。

python单线程，多线程和协程速度对比的更多相关文章

Python并发编程二（多线程、协程、IO模型）
1.python并发编程之多线程(理论) 1.1线程概念在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程线程顾名思义,就是一条流水线工作的过程(流水线的工作需要电源,电源就相当于 ...
python 多进程，多线程，协程
在我们实际编码中,会遇到一些并行的任务,因为单个任务无法最大限度的使用计算机资源.使用并行任务,可以提高代码效率,最大限度的发挥计算机的性能.python实现并行任务可以有多进程,多线程,协程等方式. ...
Python并发编程——多线程与协程
Pythpn并发编程--多线程与协程目录 Pythpn并发编程--多线程与协程 1. 进程与线程 1.1 概念上 1.2 多进程与多线程--同时执行多个任务 2. 并发和并行 3. Python多线 ...
深入浅析python中的多进程、多线程、协程
深入浅析python中的多进程.多线程.协程我们都知道计算机是由硬件和软件组成的.硬件中的CPU是计算机的核心,它承担计算机的所有任务. 操作系统是运行在硬件之上的软件,是计算机的管理者,它负责资源 ...
python并发编程之协程知识点
由线程遗留下的问题:GIL导致多个线程不能真正的并行,CPython中多个线程不能并行单线程实现并发:切换+保存状态第一种方法:使用yield,yield可以保存状态.yield的状态保存与操作系 ...
Cpython解释器下实现并发编程——多进程、多线程、协程、IO模型
一.背景知识进程即正在执行的一个过程.进程是对正在运行的程序的一个抽象. 进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一.操作系统的其他所有内容都 ...
Python之并发编程-协程
目录一.介绍二. yield.greenlet.gevent介绍 1.yield 2.greenlet 3.gevent 一.介绍协程:是单线程下的并发,又称微线程,纤程.英文名Coroutin ...
python进阶——进程/线程/协程
1 python线程 python中Threading模块用于提供线程相关的操作,线程是应用程序中执行的最小单元. #!/usr/bin/env python # -*- coding:utf-8 - ...
32 python 并发编程之协程
一引子本节的主题是基于单线程来实现并发,即只用一个主线程(很明显可利用的cpu只有一个)情况下实现并发,为此我们需要先回顾下并发的本质:切换+保存状态 cpu正在运行一个任务,会在两种情况下切走去 ...

随机推荐

Ubuntu 16.04 LTS今日发布
Ubuntu 16.04 LTS今日发布 Ubuntu16.04 LTS 发布日期已正式确定为 2016 年 4 月 21 日,代号为 Xenial Xerus.Ubuntu16.04 将是非常受欢迎 ...
AngularJS进阶(三十七)IE浏览器兼容性后续
IE浏览器兼容性后续前言继续尝试解决IE浏览器兼容性问题,结局方案为更换jquery.angularjs.IE的版本. 1.首先尝试更换jquery版本为1.7.2 jquery-1.9.1.js ...
《15个提高Google搜索的技巧》
为了得到更加「多元化」的搜索结果,虽然 Google 目前访问起来并不是那么方便,但是仍然有很多人把它作为常用搜索引擎在使用. 其实除了最简单的关键词搜索之外,搜索引擎还提供了很多精细化的搜索功能,如 ...
leetcode【67】-Bulb Switcher
题目描述: There are n bulbs that are initially off. You first turn on all the bulbs. Then, you turn off ...
如何将sqlserver的windows验证模式改为SQL Server 和 Windows 混合身份验证模式
今天问同事拷贝了份虚拟机,里面已装好sqlserver2008,可是他装的时候选择的是windows身份验证,我需要将其改成SQL Server 和 Windows 混合身份验证模式,具体步骤如下: ...
CUDA Cuts: Fast Graph Cuts on the GPU
原文出处: http://lincccc.blogspot.tw/2011/03/cuda-cuts-fast-graph-cuts-on-gpu_03.html 现在需要代理才能访问,所以就转载了. ...
《java入门第一季》之面向对象面试题
1:方法重写和方法重载的区别?方法重载能改变返回值类型吗? 方法重写: 在子类中,出现和父类中一模一样的方法声明的现象. 方法重载: 同一个类中,出现的方法名相同,参数列表不同的现象. 方法重载能改变 ...
android 线程那点事
在操作系统中,线程是操作系统调度的最小单元,同时线程又是一种受限的系统资源,即线程不可能无限制的产生,并且线程的创建和销毁都会有相应的开销,当系统中存在大量的线程时,系统会通过时间片轮转的方式调度每个 ...
让App中加入LruCache缓存,轻松解决图片过多造成的OOM
上次有过电话面试中问到Android中的缓存策略,当时模糊不清的回答,现在好好理一下吧. Android中一般情况下采取的缓存策略是使用二级缓存,即内存缓存+硬盘缓存->LruCache+Dis ...
cocos2D v3.x中动作回调函数的变化
cocos2D v3.x版本中的动作的回调函数不能再带任何参数并且不能返回任何值. 官方给出的传递参数的办法是: 选择器(selector)不能带有任何形参,选择器需要的参数必须通过ivar或prop ...

python单线程，多线程和协程速度对比

python单线程，多线程和协程速度对比的更多相关文章

随机推荐

热门专题