python多线程下载网页图片并保存至特定目录

#!python3

#multidownloadXkcd.py  - Download XKCD comics using multiple threads.

import requests

import bs4

import os

import threading

# os.mkdir('xkcd', exist_ok=True)     # store comics in ./xkcd

if os.path.exists('xkcd'):

    print("xkcd is existed!")

else:

    os.mkdir('xkcd')

def downloadXkcd(startComic, endComic):

    for urlNumber in range(startComic, endComic):

        #Download the page

        print("Downloading page http://xkcd.com/%s..." % urlNumber)

        res = requests.get('http://xkcd.com/%s' % urlNumber)

        res.raise_for_status()

        print(res.text)

        soup = bs4.BeautifulSoup(res.text)

        #Find the URL of the comic image.

        comicElem = soup.select('#comic img')

        if comicElem == []:

            print('Could not find comic images.')

        else:

            comicUrl = comicElem[0].get('src')

        #     #Download the image.

        #     print('Downloading image %s...' % (comicUrl))

        #     res = requests.get(comicUrl)

        #     res.raise_for_status()

        #

        #     # Save the image to ./xkcd

        #     imageFile = open(os.path.join('xkcd', os.path.basename(comicUrl)), 'wb')

        #     for chunk in res.iter_content(100000):

        #         imageFile.write(chunk)

        #     imageFile.close()

downloadThread = threading.Thread(target=downloadXkcd(555, 557))

downloadThread.start()

# # TODO: Create and start the thread objects

# downloadThreads = []        # a list of all the Thread objects

# for i in range(500, 600, 10):

#     downloadThread = threading.Thread(target=downloadXkcd, args=(i, i+9))

#     downloadThreads.append(downloadThread)

#     downloadThread.start()

#

# # TODO: Wait for all threads to end

# for downloadThread in downloadThreads:

#     downloadThread.join()

# print("Done.")

python多线程下载网页图片并保存至特定目录的更多相关文章

php中ob_get_contents、curl_multi_init、curl_init多线程下载远程图片并保存记录
php中三种方式测试图片下载效率原文共24张不同图,每张大小在500K以上使用时注意调整传入数组格式以及需要下载时保存地址的路径格式等这三种方式无需额外安装扩展,方便快捷易操作[虽然效率看结果没 ...
python：将网页图片保存到本地
1.requests库介绍在python中,有一个非常好用的网络请求库requests,使用它可以发起网络请求,并获取网页返回的内容.同时,也可以进行网页图片下载 requests是使用Apache ...
小白学Python（7）——利用Requests下载网页图片、视频
安装 Requests 如果安装了Requests就已经可用了,否则要安装 Requests,只要在你的CMD中运行这个简单命令即可: pip install requests requests使用 ...
Python爬虫下载美女图片（不同网站不同方法）
声明:以下代码,Python版本3.6完美运行一.思路介绍不同的图片网站设有不同的反爬虫机制,根据具体网站采取对应的方法 1. 浏览器浏览分析地址变化规律 2. Python测试类获取网页内容,从 ...
Python爬虫之网页图片抓取
一.引入这段时间一直在学习Python的东西,以前就听说Python爬虫多厉害,正好现在学到这里,跟着小甲鱼的Python视频写了一个爬虫程序,能实现简单的网页图片下载. 二.代码 __author ...
用 Python 批量下载百度图片
为了做一个图像分类的小项目,需要制作自己的数据集.要想制作数据集,就得从网上下载大量的图片,再统一处理. 这时,一张张的保存下载,就显得很繁琐.那么,有没有一种方法可以把搜索到的图片直接下载到本地 ...
python爬取网页图片（二）
从一个网页爬取图片已经解决,现在想要把这个用户发的图片全部爬取. 首先:先找到这个用户的发帖页面: http://www.acfun.cn/u/1094623.aspx#page=1 然后从这个页面中 ...
python脚本工具－1 制作爬虫下载网页图片
参考:http://www.cnblogs.com/fnng/p/3576154.html 本文参考虫师的博客“python实现简单爬虫功能”,整理分析后抓取其他站点的图片并下载保存在本地. 抓取图片 ...
Python多线程Threading爬取图片，保存本地，openpyxl批量插入图片到Excel表中
之前用过openpyxl库保存数据到Excel文件写入不了,换用xlsxwriter 批量插入图片到Excel表中 1 import os 2 import requests 3 import re ...

随机推荐

git 分支合并develop 重新拉取
1.本地包 zb-local 上传到对应的线上分支 zb-online cd 进入本地所在文件夹,然后执行下面三项 git add . git commit -m '修改' git push 或者 ...
Linux部署项目
1 安装jdk 第一步:获取Linux系统中jdk安装包和tomcat安装包(后面要用,所以上传两个) 第二步:使用secureCRT客户端工具连到服务器第三步:使用命令创建一个目录,作为软件的安装 ...
linux配置虚拟域名
linux环境下面配置虚拟主机域名第一步:在root目录下面(即根目录)ls(查看文件)cd进入etc目录find hosts文件vi hosts 打开hosts文件并进行编辑在打开的文件最下面添加 ...
python添加到环境变量
1.命令 vi ~/.bashrc export PATH="/home/tiany/software/python/python3/3.6.1/bin:$PATH" export ...
Linux系统服务之inetd
[Linux系统服务之inetd] inetd的角色是作为Telnet和FTP等与网络服务器相关的进程的“超级服务器”.这是一个简单的道理:并不是全部的服务器进程(包括那些接受新的Telnet和FTP ...
yum更换阿里源
备份mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup 下载新的CentOS-Base.repo ...
c++中的类（class）-----笔记（类多态）
1,多态是一种运行期绑定机制,通过这种机制,实现将函数名绑定到函数具体实现代码的目的.一个函数的名称与其入口地址是紧密相连的,入口地址是该函数在内存中的起始地址.如果对一个函数的绑定发生在运行时刻而非 ...
LibreOJ 6277. 数列分块入门 1
题目链接:https://loj.ac/problem/6277 参考博客:https://www.cnblogs.com/stxy-ferryman/p/8547731.html 两个操作,区间增加 ...
解决 HDFS 开发 java.lang.IllegalArgumentException: java.net.UnknownHostException: hadoop000
出现这种问题多半是windows找不到linux主机所以在这个路径下的hosts加上linux ip地址,主机名就可以了
centos6与centos7区别
CentOS 6 vs CentOS 7的不同 (1)桌面系统[CentOS6] GNOME 2.x[CentOS7] GNOME 3.x(GNOME Shell) (2)文件系统[CentOS6 ...

python多线程下载网页图片并保存至特定目录

python多线程下载网页图片并保存至特定目录的更多相关文章

随机推荐

热门专题