python 并发爬虫的快感

import time

from tomorrow import threads

from requests_html import HTMLSession

session=HTMLSession()

@threads(50)  # 使用装饰器，这个函数异步执行

def download(url):

    return session.get(url)

def main():

    start = time.time()

    urls = [

        'https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879','https://pypi.org/project/tomorrow/0.2.0/',

        'https://www.cnblogs.com/pyld/p/4716744.html',

        'http://www.xicidaili.com/nn/10',

        'http://baidu.com',

        'http://www.bubuko.com/infodetail-1028793.html?yyue=a21bo.50862.201879'

    ]

    req_list=[]

    for i in urls:

        req_list.append(download(i))

    print(req_list)

    responses = [i.html.xpath("//title/text()") for i in req_list]

    print(responses)

    end = time.time()

    print("Time: %f seconds" % (end - start))

if __name__ == "__main__":

    main()

python 并发爬虫的快感的更多相关文章

python并发爬虫利器tomorrow(一)
tomorrow是我最近在用的一个爬虫利器,该模块属于第三方的一个模块,使用起来非常的方便,只需要用其中的threads方法作为装饰器去修饰一个普通的函数,既可以达到并发的效果,本篇将用实例来展示to ...
python异步爬虫
本文主要包括以下内容线程池实现并发爬虫回调方法实现异步爬虫协程技术的介绍一个基于协程的异步编程模型协程实现异步爬虫线程池.回调.协程我们希望通过并发执行来加快爬虫抓取页面的速度.一般的实 ...
Python并发编程之深入理解yield from语法（八）
大家好,并发编程进入第八篇. 直到上一篇,我们终于迎来了Python并发编程中,最高级.最重要.当然也是最难的知识点--协程. 当你看到这一篇的时候,请确保你对生成器的知识,有一定的了解.当然不了解 ...
Python并发编程二（多线程、协程、IO模型）
1.python并发编程之多线程(理论) 1.1线程概念在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程线程顾名思义,就是一条流水线工作的过程(流水线的工作需要电源,电源就相当于 ...
基于Scrapy框架的Python新闻爬虫
概述该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地详细代码下载:http://www.demoda ...
python并发编程&多进程(二)
前导理论知识见:python并发编程&多进程(一) 一 multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_cou ...
Python分布式爬虫抓取知乎用户信息并进行数据分析
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了... 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目, ...
《实战Python网络爬虫》- 感想
端午节假期过了,之前一直在做出行准备,后面旅游完又休息了一下,最近才恢复状态. 端午假期最后一天收到一个快递,回去打开,发现是微信抽奖中的一本书,黄永祥的<实战Python网络爬虫>. 去 ...
Python网络爬虫与信息提取
1.Requests库入门 Requests安装用管理员身份打开命令提示符: pip install requests 测试:打开IDLE: >>> import requests ...

随机推荐

HDU4043_FXTZ II
题目描述的意思就不说了,自己考虑的时候就是在所有的排列中,碰到大于前面最大的出现数字的时候就乘以一个二分之一,然后求和. 打表后就会发现,答案分子为1*3*5*……*(2*n-1):分母为2*4*6* ...
bzoj1390 [CEOI2008] Fence
题意给出n个白点和m个黑点.现在你需要选择一些白点把黑点圈起来.每有一个黑点不能被选出的白点组成的凸包包含就需要付出111的代价,每选出一个白点就需要付出20的代价.要求最小化代价之和 n,m< ...
BZOJ4888 Tjoi2017异或和（树状数组）
化为前缀和相减.考虑每一位的贡献.则需要快速查询之前有几个数和当前数的差在第k位上为1.显然其与更高位是无关的.于是用BIT维护后k位的数的出现次数,瞎算一算即可. // luogu-judger-e ...
洛谷 P2421 A-B数对（增强版）
题目描述给出N 个从小到大排好序的整数,一个差值C,要求在这N个整数中找两个数A 和B,使得A-B=C,问这样的方案有多少种? 例如:N=5,C=2,5 个整数是:2 2 4 8 10.答案是3.具 ...
二分图匹配模板（dfs+bfs）
dfs版: bool dfs(int u) { for(int i = head[u]; ~i; i = e[i].next) { int v = e[i].v; if(!vis[v]) { vis[ ...
洛谷P1658 购物
题目戳题目描述你就要去购物了,现在你手上有N种不同面值的硬币,每种硬币有无限多个.为了方便购物,你希望带尽量少的硬币,但要能组合出1到X之间的任意值. 输入输出格式输入格式: 第一行两个数X.N ...
InnoDB事务日志（redo log 和 undo log）详解
数据库通常借助日志来实现事务,常见的有undo log.redo log,undo/redo log都能保证事务特性,undolog实现事务原子性,redolog实现事务的持久性. 为了最大程度避免数 ...
Qt浅谈内存泄露（总结）
Qt浅谈内存泄露(总结) 来源 http://blog.csdn.net/taiyang1987912/article/details/29271549 一.简介 Qt内存管理机制:Qt 在内部能够维 ...
[CF1105D]Kilani and the Game
题目大意:给出一个$n\times m(n,m\leqslant10^3)$的地图,有$k(k\leqslant9)$个玩家,第$i$个玩家速度为$s_i$.地图中$\#$代表障碍:$.$ 代表空地: ...
Kinect实现简单的三维重建
Kinect想必大家已经很熟悉了,最近基于Kinect的创意应用更是呈井喷状态啊!看到很多国外大牛用Kinect做三维重建,其中最著名的要数来自微软研究院的Kinect Fusion了,可以看看下面这 ...

python 并发爬虫的快感

python 并发爬虫的快感的更多相关文章

随机推荐

热门专题