python 并发爬虫的快感

import time

from tomorrow import threads

from requests_html import HTMLSession

session=HTMLSession()

@threads(50)  # 使用装饰器，这个函数异步执行

def download(url):

    return session.get(url)

def main():

    start = time.time()

    urls = [

        'https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879'

    ]

    req_list=[]

    for i in urls:

        req_list.append(download(i))

    print(req_list)

    responses = [i.html.xpath("//title/text()") for i in req_list]

    print(responses)

    end = time.time()

    print("Time: %f seconds" % (end - start))

if __name__ == "__main__":

    main()

python 并发爬虫的快感的更多相关文章

python并发爬虫利器tomorrow(一)
tomorrow是我最近在用的一个爬虫利器,该模块属于第三方的一个模块,使用起来非常的方便,只需要用其中的threads方法作为装饰器去修饰一个普通的函数,既可以达到并发的效果,本篇将用实例来展示to ...
python异步爬虫
本文主要包括以下内容线程池实现并发爬虫回调方法实现异步爬虫协程技术的介绍一个基于协程的异步编程模型协程实现异步爬虫线程池.回调.协程我们希望通过并发执行来加快爬虫抓取页面的速度.一般的实 ...
Python并发编程之深入理解yield from语法（八）
大家好,并发编程进入第八篇. 直到上一篇,我们终于迎来了Python并发编程中,最高级.最重要.当然也是最难的知识点--协程. 当你看到这一篇的时候,请确保你对生成器的知识,有一定的了解.当然不了解 ...
Python并发编程二（多线程、协程、IO模型）
1.python并发编程之多线程(理论) 1.1线程概念在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程线程顾名思义,就是一条流水线工作的过程(流水线的工作需要电源,电源就相当于 ...
基于Scrapy框架的Python新闻爬虫
概述该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地详细代码下载:http://www.demoda ...
python并发编程&多进程(二)
前导理论知识见:python并发编程&多进程(一) 一 multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_cou ...
Python分布式爬虫抓取知乎用户信息并进行数据分析
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了... 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目, ...
《实战Python网络爬虫》- 感想
端午节假期过了,之前一直在做出行准备,后面旅游完又休息了一下,最近才恢复状态. 端午假期最后一天收到一个快递,回去打开,发现是微信抽奖中的一本书,黄永祥的<实战Python网络爬虫>. 去 ...
Python网络爬虫与信息提取
1.Requests库入门 Requests安装用管理员身份打开命令提示符: pip install requests 测试:打开IDLE: >>> import requests ...

随机推荐

【.Net】C# 将Access中时间段条件查询的数据添加到ListView中
一.让ListView控件显示表头的方法在窗体中添加ListView 空间,其属性中设置:View属性设置为:Detail,Columns集合中添加表头中的文字. 二.利用代码给ListView添加 ...
Android四大组件之Activity & Fragement（续）
1.Activity和Fragment的异同. Activity是UI界面交互的主体,而fragment是这个主体上的元素. 一个activity可以包含0到n个fragment. fragment可 ...
用PHP写出显示客户端IP与服务器IP的代码
打印客户端IP: echo $_SERVER[‘REMOTE_ADDR’]; 或者: getenv(‘REMOTE_ADDR’); 打印服务器IP: echo gethostbyname(“www.b ...
洛谷 P1987 摇钱树
题目戳题目描述 Cpg 正在游览一个梦中之城,在这个城市中有n棵摇钱树...这下,可让Cpg看傻了...可是Cpg只能在这个城市中呆K天,但是现在摇钱树已经成熟了,每天每棵都会掉下不同的金币(不属于 ...
VSS2005清除管理员密码
1.下载工具ultraedit 2.登录到服务器,找到VSS库文件夹,data\um.dat 3.复制到自己桌面,用ultraedit打开,进入引用内容 00000080h: 55 55 03 29 ...
python基础----__next__和__iter__实现迭代器协议
#_*_coding:utf-8_*_ __author__ = 'Linhaifeng' class Foo: def __init__(self,x): self.x=x def __iter__ ...
winform设计一个登录界面和修改密码的界面-自动切换窗体（问题[已解] 望一起讨论）(技术改变世界-cnblog)
http://www.cnblogs.com/IAmBetter/archive/2012/01/14/2322156.html winform设计一个登录界面和修改密码的界面-自动切换窗体(问题[已 ...
SGU179 Brackets light
179. Brackets light time limit per test: 0.25 sec. memory limit per test: 131072 KB input: standard ...
VC++的debug与release版本
因为在Debug中有ASSERT断言保护,所以要崩溃,而在Release优化中就会删掉ASSERT,所以会出现正常运行. void func() { char b[2]={0}; strc ...
python学习(十三)进程和线程
python多进程 from multiprocessing import Process import os def processFunc(name): print("child pro ...

python 并发爬虫的快感

python 并发爬虫的快感的更多相关文章

随机推荐

热门专题