python多线程下载网页图片并保存至特定目录

#!python3

#multidownloadXkcd.py  - Download XKCD comics using multiple threads.

import requests

import bs4

import os

import threading

# os.mkdir('xkcd', exist_ok=True)     # store comics in ./xkcd

if os.path.exists('xkcd'):

    print("xkcd is existed!")

else:

    os.mkdir('xkcd')

def downloadXkcd(startComic, endComic):

    for urlNumber in range(startComic, endComic):

        #Download the page

        print("Downloading page http://xkcd.com/%s..." % urlNumber)

        res = requests.get('http://xkcd.com/%s' % urlNumber)

        res.raise_for_status()

        print(res.text)

        soup = bs4.BeautifulSoup(res.text)

        #Find the URL of the comic image.

        comicElem = soup.select('#comic img')

        if comicElem == []:

            print('Could not find comic images.')

        else:

            comicUrl = comicElem[0].get('src')

        #     #Download the image.

        #     print('Downloading image %s...' % (comicUrl))

        #     res = requests.get(comicUrl)

        #     res.raise_for_status()

        #

        #     # Save the image to ./xkcd

        #     imageFile = open(os.path.join('xkcd', os.path.basename(comicUrl)), 'wb')

        #     for chunk in res.iter_content(100000):

        #         imageFile.write(chunk)

        #     imageFile.close()

downloadThread = threading.Thread(target=downloadXkcd(555, 557))

downloadThread.start()

# # TODO: Create and start the thread objects

# downloadThreads = []        # a list of all the Thread objects

# for i in range(500, 600, 10):

#     downloadThread = threading.Thread(target=downloadXkcd, args=(i, i+9))

#     downloadThreads.append(downloadThread)

#     downloadThread.start()

#

# # TODO: Wait for all threads to end

# for downloadThread in downloadThreads:

#     downloadThread.join()

# print("Done.")

python多线程下载网页图片并保存至特定目录的更多相关文章

php中ob_get_contents、curl_multi_init、curl_init多线程下载远程图片并保存记录
php中三种方式测试图片下载效率原文共24张不同图,每张大小在500K以上使用时注意调整传入数组格式以及需要下载时保存地址的路径格式等这三种方式无需额外安装扩展,方便快捷易操作[虽然效率看结果没 ...
python：将网页图片保存到本地
1.requests库介绍在python中,有一个非常好用的网络请求库requests,使用它可以发起网络请求,并获取网页返回的内容.同时,也可以进行网页图片下载 requests是使用Apache ...
小白学Python（7）——利用Requests下载网页图片、视频
安装 Requests 如果安装了Requests就已经可用了,否则要安装 Requests,只要在你的CMD中运行这个简单命令即可: pip install requests requests使用 ...
Python爬虫下载美女图片（不同网站不同方法）
声明:以下代码,Python版本3.6完美运行一.思路介绍不同的图片网站设有不同的反爬虫机制,根据具体网站采取对应的方法 1. 浏览器浏览分析地址变化规律 2. Python测试类获取网页内容,从 ...
Python爬虫之网页图片抓取
一.引入这段时间一直在学习Python的东西,以前就听说Python爬虫多厉害,正好现在学到这里,跟着小甲鱼的Python视频写了一个爬虫程序,能实现简单的网页图片下载. 二.代码 __author ...
用 Python 批量下载百度图片
为了做一个图像分类的小项目,需要制作自己的数据集.要想制作数据集,就得从网上下载大量的图片,再统一处理. 这时,一张张的保存下载,就显得很繁琐.那么,有没有一种方法可以把搜索到的图片直接下载到本地 ...
python爬取网页图片（二）
从一个网页爬取图片已经解决,现在想要把这个用户发的图片全部爬取. 首先:先找到这个用户的发帖页面: http://www.acfun.cn/u/1094623.aspx#page=1 然后从这个页面中 ...
python脚本工具－1 制作爬虫下载网页图片
参考:http://www.cnblogs.com/fnng/p/3576154.html 本文参考虫师的博客“python实现简单爬虫功能”,整理分析后抓取其他站点的图片并下载保存在本地. 抓取图片 ...
Python多线程Threading爬取图片，保存本地，openpyxl批量插入图片到Excel表中
之前用过openpyxl库保存数据到Excel文件写入不了,换用xlsxwriter 批量插入图片到Excel表中 1 import os 2 import requests 3 import re ...

随机推荐

XML 可扩展标记语言
因为XML实在是太重要了,而且被广泛应用!不论是数据存储,还是其他方面,如配置文件等.XML是一种对独立于任何编程语言的数据进行编码的机制.在数据交换领域,正在变得非常流行!因为他的基于节点的存储 ...
JS----addEventListener()
addEventListener() 用于向指定元素添加事件. 可以向一个元素添加多次事件或者多次不同事件,后面的事件是不会覆盖前面的. 语法: element.addEventListener(ev ...
学习-HTML5
@@ 学习HTML5发现对我们开发工作者来说要方便很多,它现在还在发展阶段,在未来肯定会是主流. 我们知道HTML5目的是取代HTML4.01和XHTML1.0标准,他希望能够减少互联网富应用(RIA ...
Rx操作符
[Rx操作符] 1.Observable.from()方法,它接收一个集合作为输入,然后每次输出一个元素给subscriber: Observable.from("url1", & ...
appium桌面版本以及一些自动化测试方方封装
appium_desktop 标签(空格分隔): appium_desktop 一 appium_desktop_v1.2.6 1.appium_desktop在github上最新下载地址:appiu ...
Python之-------基础数据类型
数据类型: 计算可以处理各种不同文件,图形,音频,视频,网页等各种各样的数据,不同的数据,需要定义不同的数据类型.在Python中,能够直接处理的数据类型有以下几种: 一:nubmer(数字) 1.1 ...
FP ABPPMGR表其它常用存储过程
SAP_MATERIAL_SO:处理材料订单缺少BOM,ROUTING信息 1. 增加这部分订单的BOM信息 2. 增加这部分订单材料的ROUTING信息 3. 如果是 ...
python学习 day19 configparser模块 os模块 subprocess模块
上周五回顾 logging 用于记录日志四种核心角色: 生成器Logger 过滤器Filter 处理器Handler 格式化处理器 Formatter logging.info.debug 使用默认 ...
Laravel5.1 与 Laypage 结合进行分页
demo地址:http://lara.ytlwin.top/orm 路由 Route::match(array('get','post'),'/orm','StuController@orm'); 控 ...
vue bus 的使用
简单的状态管理,可以用vue bus vue bus可以实现不同组件间.不同页面间的通信,比如我在A页面出发点击事件,要B页面发生变化,使用方法如下: 全局定义:main.js window.even ...

python多线程下载网页图片并保存至特定目录

python多线程下载网页图片并保存至特定目录的更多相关文章

随机推荐

热门专题