python3爬取高清壁纸(2)

上次只是爬取一个专辑的图片，这次要爬取一整个页面的所有专辑的图片。

在上次的代码的基础上进行修改就行了，从专辑的索引页面开始，爬取该页面上所有的专辑的链接，再套用上次的代码就行了。

若要爬取多个页面只需在外围套上一个循环就可以了。

代码如下：

import requests

import re

from bs4 import BeautifulSoup

import os

#爬取的网站：http://www.win4000.com/wallpaper_detail_54520.html

def Get_image_url(url):

    #传入页面的URL，得到所有图片所在的标签和图册的名字，并返回

    Res = requests.get(url)

    Soup = BeautifulSoup(Res.text,'lxml')

    Name = Soup.select('h1')[0].string

    Tag = 'img[title=\"' + Name + '\"]'

    Image = Soup.select(Tag)

    return Image,Name

def Download_Image(Image_url):

    #传入图片的URL，将图片保存在本地

    Image = requests.get(Image_url,stream=True)

    #将链接的最后一个字符串最为图片的名字

    name = Image_url.split('/')[-1]

    #白村图片

    with open(name,'wb') as f:

        f.write(Image.content)

def Get_index_image(Url):

    Res = requests.get(Url)

    Reg = r'<a href="(.+?)" title=.+? target='

    Reg = re.compile(Reg)

    Image = re.findall(Reg,Res.text)

    Image = set(Image)

    Image = [i for i in Image if len(i) > 49]

    return Image

def main(url):

    #主调函数

    #url = "http://www.win4000.com/wallpaper_detail_54520.html"

    [Image,Name] = Get_image_url(url)

    #print(Name,Image)

    #保存当前目录

    path = os.getcwd()

    #创建保存图片的目录

    if (not os.path.exists(Name)):

        os.mkdir(Name)

        os.chdir(path + '/' + Name)

        for I in Image:

            Download_Image(I['src'])

        #返回之前的目录

        os.chdir(path)

        print(Name+'\n')

    else:

        print(Name + " 已经下载过了")

if __name__ == '__main__':

    Main_Url = "http://www.win4000.com/wallpaper_192_0_0_1.html"

    Url = Get_index_image(Main_Url)

    for u in Url:

        main(u)

    print("下载完成！")

python3爬取高清壁纸(2)的更多相关文章

python3爬取高清壁纸(1)
这次爬取的目标是:美桌网首页 > 桌面壁纸 > 卡通动漫类别下的壁纸. 我们先随机选取一个专辑来爬(http://www.win4000.com/wallpaper_detail_545 ...
Python 爬取高清桌面壁纸
今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片: 链接:http://desk.zol.com.cn/1920x1080/ 本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的&quo ...
python 爬取王者荣耀高清壁纸
代码地址如下:http://www.demodashi.com/demo/13104.html 一.前言打过王者的童鞋一般都会喜欢里边设计出来的英雄吧,特别想把王者荣耀的英雄的高清图片当成电脑桌面 ...
别人用钱，而我用python爬虫爬取了一年的4K高清壁纸
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取htt ...
Nginx+uWSGI+Python+Django构建必应高清壁纸站
写在前面做这个网站的初衷是因为,每次打开必应搜索搜东西的时候都会被上面的背景图片吸引,我想必应的壁纸应该是经过专业人员精选出来的,我甚至会翻看以前的历史图片,唯一美中不足的是必应的首页只能查看最多7 ...
python3爬取网页
爬虫 python3爬取网页资源方式(1.最简单: import'http://www.baidu.com/'print2.通过request import'http://www.baidu.com' ...
python3爬取女神图片，破解盗链问题
title: python3爬取女神图片,破解盗链问题 date: 2018-04-22 08:26:00 tags: [python3,美女,图片抓取,爬虫, 盗链] comments: true ...
Python3 爬取微信好友基本信息，并进行数据清洗
Python3 爬取微信好友基本信息,并进行数据清洗 1,登录获取好友基础信息: 好友的获取方法为get_friends,将会返回完整的好友列表. 其中每个好友为一个字典列表的第一项为本人的账号信息 ...
android 高清壁纸设置慢
由于项目的需要最近在解决一个 bug 在1080p 的手机上面设置壁纸会很慢慢,慢的原因是和壁纸的大小有关,壁纸越大,时间直越长,一般1080 p 的壁纸大概有10M左右, 所以通过文件流来保 ...

随机推荐

Centos 7 配置 NFS
安装NFS包 yum install nfs-utils.x86_64 启动NFS服务需要首先启动rpcbind服务,这个rpcbind包已经在上面安装好了先配置 /etc/exports 文件 v ...
PHP Help Guideds
how does php work with Apache? https://stillat.com/blog/2014/04/02/how-does-php-work-with-the-web-se ...
[CF1303F] Number of Components - 并查集,时间倒流
有一个 $n \times m$ 矩阵,初态下全是 $0$. 如果两个相邻元素(四连通)相等,我们就说它们是连通的,且这种关系可以传递. 有 $q$ 次操作,每次指定一个位置 \((x_i ...
为什么要使用Redis？ —— Redis实战经验
(序言,从一张思维导图开始,慢慢介绍我自己关于Redis的实战经验) 现在很多互联网应用的服务端都使用到了Redis,到底大家为什么要用Redis呢?Redis有很多特性,比如高性能.高可用.数据类型 ...
java学习笔记之集合—ArrayList源码解析
1.ArrayList简介 ArrayList是一个数组队列,与java中的数组的容量固定不同,它可以动态的实现容量的增涨.所以ArrayList也叫动态数组.当我们知道有多少个数据元素的时候,我们用 ...
VSCode C语言编程（二）新建项目及编译
添加工作区: 把文件夹在工作区删除: 把HelloWorld模板文件夹解压到工作目录模板下载(代码解释请看模板里的注释) 添加项目文件夹: 编辑器打开的文件必须与main.c同目录点击右边编译图标 ...
Mysql分库分表导出导入和数据量统计测试
需求:添加创建了分库分表后,业务可能将数据已经写入,但未来得及接入到otter汇总库.接入汇总库前需要初始化这部分数据. 1.导出 ip_port_list ) len=${#ip_port_list ...
0002 PyCharm设置
1 设置编码格式 File/Settings/Editor/File Encodings 2 设置字体 File/Settings/Editor/Font 3 鼠标滚轮改变编辑器字体大小 File/S ...
shell输入输出
输出一.echo命令介绍 1.功能:将内容输出到默认显示设备 2.语法:echo [-ne] [字符串] :输出的字符串以空格隔开,默认会加上换行符 3.选项 -n 不要在最后自动换行 -e 如果字 ...
Codeforces Round #617 (Div. 3) 题解
又是隔了一年才来补题的我 A.B水题就不用说了 C - Yet Another Walking Robot C题我居然卡了一会,最后决定用map水,结果出来看了看题解,居然真的是map...没想到会出 ...

python3爬取高清壁纸(2)

python3爬取高清壁纸(2)的更多相关文章

随机推荐

热门专题