【爬虫】python 多线程知识

第一段代码：

 __author__ = 'Administrator'

 import threading

 import time

 index = 0

 class MyThread(threading.Thread):

     def __init__(self, threadname, counter):

         super(MyThread, self).__init__()

         self.threadname = threadname

         self.counter = counter

     def run(self):

         global index

         print "starting " + self.threadname

         while self.counter:

             time.sleep(1)

             index += 1

             print "threadname: %s\tindex:%d\ttime: %s\n"%(self.threadname, index, time.ctime())

             self.counter -= 1

 def main():

     print '=======================BEGIN==========================='

     thread1 = MyThread('thread1', 10)

     thread2 = MyThread('thread2', 5)

     thread1.start()

     thread2.start()

     thread1.join()

     thread2.join()

     print '========================END============================'

 if __name__ == '__main__':

     main()

第二段代码：

 # -*- coding: gbk -*-

 __author__ = 'Administrator'

 import threading

 import random, time, Queue

 # 缓冲队列大小为5

 MAX_SIZE = 5

 # 模拟队列

 SHARE_Q = []

 # 条件变量

 CONDITION = threading.Condition()

 class Producer(threading.Thread):

     def run(self):

         products = range(5)

         global SHARE_Q

         while True:

             # 获得锁

             CONDITION.acquire()

             # 队列如果满了，则等待资源释放

             if len(SHARE_Q) == 5:

                 print "Queue is full..."

                 CONDITION.wait()

                 print "Consumer have consumed something"

             product = random.choice(products)

             SHARE_Q.append(product)

             print "Producer : ", product

             CONDITION.notify()

             CONDITION.release()

             time.sleep(3)

 class Consumer(threading.Thread):

     def run(self):

         global SHARE_Q

         while True:

             CONDITION.acquire()

             # 队列为空，消费者不能进行消费

             if not SHARE_Q:

                 print "Queue is Empty..."

                 CONDITION.wait()

                 print "Producer have produced something"

             product = SHARE_Q.pop(0)

             print "Consumer: ", product

             CONDITION.notify()

             CONDITION.release()

             time.sleep(2)

 def main():

     producer = Producer()

     consumer = Consumer()

     producer.start()

     consumer.start()

 if __name__ == '__main__':

     main()

【爬虫】python 多线程知识的更多相关文章

python多线程知识-实用实例
python多线程使用场景:IO操作,不适合CPU密集操作型任务 1.多个线程内存共享 2.线程同时修改同一份数据需要加锁,mutex互斥锁 3.递归锁:多把锁,锁中有锁 4.python多线程, ...
【Python爬虫】入门知识
爬虫基本知识这阵子需要用爬虫做点事情,于是系统的学习了一下python爬虫,觉得还挺有意思的,比我想象中的能干更多的事情,这里记录下学习的经历. 网上有关爬虫的资料特别多,写的都挺复杂的,我这里不打 ...
python多线程爬虫设计及实现示例
爬虫的基本步骤分为:获取,解析,存储.假设这里获取和存储为io密集型(访问网络和数据存储),解析为cpu密集型.那么在设计多线程爬虫时主要有两种方案:第一种方案是一个线程完成三个步骤,然后运行多个线程 ...
python爬虫主要就是五个模块：爬虫启动入口模块，URL管理器存放已经爬虫的URL和待爬虫URL列表，html下载器，html解析器，html输出器同时可以掌握到urllib2的使用、bs4（BeautifulSoup）页面解析器、re正则表达式、urlparse、python基础知识回顾（set集合操作）等相关内容。
本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...
python多线程爬虫+批量下载斗图啦图片项目（关注、持续更新）
python多线程爬虫项目() 爬取目标:斗图啦(起始url:http://www.doutula.com/photo/list/?page=1) 爬取内容:斗图啦全网图片使用工具:requests ...
python 爬虫与数据可视化--python基础知识
摘要:偶然机会接触到python语音,感觉语法简单.功能强大,刚好朋友分享了一个网课<python 爬虫与数据可视化>,于是在工作与闲暇时间学习起来,并做如下课程笔记整理,整体大概分为4个 ...
python爬虫之多线程、多进程+代码示例
python爬虫之多线程.多进程使用多进程.多线程编写爬虫的代码能有效的提高爬虫爬取目标网站的效率. 一.什么是进程和线程引用廖雪峰的官方网站关于进程和线程的讲解: 进程:对于操作系统来说,一个任 ...
线程概念( 线程的特点,进程与线程的关系, 线程和python理论知识,线程的创建)
参考博客: https://www.cnblogs.com/xiao987334176/p/9041318.html 线程概念的引入背景进程之前我们已经了解了操作系统中进程的概念,程序并不能单独运 ...
python 全栈开发，Day41(线程概念,线程的特点,进程和线程的关系,线程和python 理论知识,线程的创建)
昨日内容回顾队列队列 : 先进先出.数据进程安全队列实现方式: 管道 + 锁生产者消费者模型 : 解决数据供需不平衡管道双向通信数据进程不安全 EOFError: 管道是由操作系统进行引 ...

随机推荐

解决Sourcetree 每次拉取提交都需要输入密码
问题产生背景客户端领导决定使用http方式拉取和push代码,所以无法使用之前的ssh方式做免密处理解决办法方法1:在.git目录中有个config目录,在路径前配置下用户名和密码即可,如下所示 ...
dijkstra spfa prim kruskal 总结
最短路和最小生成树应该是很早学的,大家一般都打得烂熟,总结一下几个问题一 dijkstra O((V+E)lgV) //V节点数 E边数 dijkstra不能用来求最长路,因为此时局部最优解已经 ...
「6月雅礼集训 2017 Day7」回转寿司
[题目大意] 给一个n个数的序列,q次操作,每次选择区间$[l,r]$,给出数p,对于区间$[l,r]$的每个数$x$,做如下操作: 如果$x > p$,就交换$x$和$p$.求每次操作后$p$ ...
JS语句循环（100以内奇偶数、100以内与7先关的数、100以内整数的和、10以内阶乘、乘法口诀、篮球弹起高度、64格子放东西）
3.循环循环是操作某一个功能(执行某段代码). ①循环四要素: a 循环初始值 b 循环的条件 c 循环状态 d 循环体 ②for循环 a 穷举:把所有的可能性的都一一列出来. b 迭代:每次循环都 ...
this可以通过call改变的测试
Python学习笔记 - day14 - Celery异步任务
Celery概述关于celery的定义,首先来看官方网站: Celery(芹菜) 是一个简单.灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具. 简单来看,是一个基于pyt ...
netlink socket编程
转载原文地址:netlink socket编程之why & how (转) 作者:renyuan000 作者: Kevin Kaichuan He@2005-1-5 翻译整理:duanjig ...
Git常规配置与基本用法
Git环境配置一. 全局配置 1. 配置文件 git全局配置文件.gitconfig默认在当前系统用户文件夹下,window可运行%USERPROFILE%查找,Mac系统在cd ~查找. 具体配置 ...
pxc群集搭建
pxc群集搭建 1.环境 Percona-XtraDB 5.7.22-22-29.26-log percona-xtrabackup-24-2.4.12 192.168.99.210:3101(第一节 ...
微信小程序获取输入框(input)内容
微信小程序---获取输入框(input)内容 wxml <input placeholder="请输入手机号码" maxlength="11" type= ...

【爬虫】python 多线程知识

【爬虫】python 多线程知识的更多相关文章

随机推荐

热门专题