1. 前期准备

1.1 开发工具

Python 3.6

Pycharm Pro 2017.3.2

Text文本

1.2 Python库

requests

re

urllib

如果没有这些Python库，使用以下方法

pip install 需要安装的包名(Ps： pip install requests)

2. 配置系统主题文件

个人经过和系统主题对比写了一个主题文件代码，大家可以拷贝到text文本中另存为*.theme文件，我这里命名为lamborghini.theme

; Copyright ?Microsoft Corp.

[Theme]

; Windows 7 - IDS_THEME_DISPLAYNAME_AERO

DisplayName=兰博基尼 # 个性化主题名称

SetLogonBackground=0

; Computer - SHIDI_SERVER

[CLSID\{20D04FE0-3AEA-1069-A2D8-08002B30309D}\DefaultIcon]

DefaultValue=%SystemRoot%\System32\imageres.dll,-109

; UsersFiles - SHIDI_USERFILES

[CLSID\{59031A47-3F72-44A7-89C5-5595FE6B30EE}\DefaultIcon]

DefaultValue=%SystemRoot%\System32\imageres.dll,-123

; Network - SHIDI_MYNETWORK

[CLSID\{F02C1A0D-BE21-4350-88B0-7367FC96EF3C}\DefaultIcon]

DefaultValue=%SystemRoot%\System32\imageres.dll,-25

; Recycle Bin - SHIDI_RECYCLERFULL SHIDI_RECYCLER

[CLSID\{645FF040-5081-101B-9F08-00AA002F954E}\DefaultIcon]

Full=%SystemRoot%\System32\imageres.dll,-54

Empty=%SystemRoot%\System32\imageres.dll,-55

[Control Panel\Cursors]

AppStarting=%SystemRoot%\cursors\aero_working.ani

Arrow=%SystemRoot%\cursors\aero_arrow.cur

Crosshair=

Hand=%SystemRoot%\cursors\aero_link.cur

Help=%SystemRoot%\cursors\aero_helpsel.cur

IBeam=

No=%SystemRoot%\cursors\aero_unavail.cur

NWPen=%SystemRoot%\cursors\aero_pen.cur

SizeAll=%SystemRoot%\cursors\aero_move.cur

SizeNESW=%SystemRoot%\cursors\aero_nesw.cur

SizeNS=%SystemRoot%\cursors\aero_ns.cur

SizeNWSE=%SystemRoot%\cursors\aero_nwse.cur

SizeWE=%SystemRoot%\cursors\aero_ew.cur

UpArrow=%SystemRoot%\cursors\aero_up.cur

Wait=%SystemRoot%\cursors\aero_busy.ani

DefaultValue=Windows Aero

DefaultValue.MUI=@main.cpl,-1020

[Control Panel\Desktop]

Wallpaper=D:\Wallpaper\lamborghini\139_151202104128_86504.jpg # 初始化图片

TileWallpaper=0

WallpaperStyle=10

Pattern=

[VisualStyles]

Path=%ResourceDir%\Themes\Aero\Aero.msstyles

ColorStyle=NormalColor

Size=NormalSize

ColorizationColor=0XA84F1B1B

Transparency=1

[boot]

SCRNSAVE.EXE=

[MasterThemeSelector]

MTSM=DABJDKT

[Sounds]

; IDS_SCHEME_DEFAULT

SchemeName=@%SystemRoot%\System32\mmres.dll,-800

[Slideshow]

Interval=60000 # 动画时间

Shuffle=0

ImagesRootPath=D:\Wallpaper\ #图片路径

----- 以下不要拷贝，用Python批量添加 -----

Item0Path=D:\Wallpaper\lamborghini\aventador_s-007.jpg

Item1Path=D:\Wallpaper\lamborghini\aventador_s-006.jpg

Item2Path=D:\Wallpaper\lamborghini\aventador_s-005.jpg

Item3Path=D:\Wallpaper\lamborghini\aventador_s-004.jpg

Item4Path=D:\Wallpaper\lamborghini\aventador_s-003.jpg

Item5Path=D:\Wallpaper\lamborghini\aventador_s-002.jpg

Item6Path=D:\Wallpaper\lamborghini\aventador_s-001.jpg

个性化主题配置文件

3.获取页面地址

3.1 获取需要爬取的网页地址

url:http://www.ivsky.com/search.php?q=%E5%85%B0%E5%8D%9A%E5%9F%BA%E5%B0%BC&PageNo=2
q 查询的数据
PageNo 页码

3.2 获取爬取页面分页图片地址

img_url:http://img.ivsky.com/img/bizhi/pic/201804/17/aventador_s-007.jpg

img_url:http://img.ivsky.com/img/bizhi/pre/201804/17/aventador_s-007.jpg

pic 原图

pre 缩略图

4.编写爬虫

import requests, re, urllib.request

class Ivsky_Spider:

    def __init__(self, new_search_name):

        """初始化"""

        self.url_search = 'http://www.ivsky.com/search.php?q=%s' % urllib.request.quote(new_search_name) # 网站搜索

        self.url = re.findall(r'(http://.*?)/', self.url_search)[0] # 网站地址

        self.headers = {

            'User-Agent': 'Mozilla/5.0', # 伪装成浏览器访问

            'Referer': self.url # 是否合法

        }

    def Spider(self):

        """主程序"""

        i = 1

        while True:

            try:

                print('='*30 + '第%d页' % i + '='*30)

                respone = self.Get_Html_Respone(self.url_search + '&PageNo=' + str(i)).text

                page_temp = re.findall(r'<div class="pagelist">.*?</div>', respone, re.S)[0]

                if str(i) in page_temp:

                    self.Get_Img_Download(i, respone)

                else:

                    print('=' * 30 + '程序爬取完成' + '=' * 30)

                    return

                i += 1

            except Exception as e:

                print('报错信息：%s\n程序退出' % e)

                return

    def Get_Html_Respone(self, new_url):

        """网站Get请求"""

        respone = requests.get(url=new_url, headers=self.headers) # Get请求

        respone.encoding = 'utf-8' # 网页编码转为utf-8

        return respone

    def Get_Img_Download(self, page, new_respone):

        """图片下载"""

        print('-' * 20 + '正在获取第%d页图片内容' % page + '-' * 20)

        img_url_temp = re.findall(r'<div class="left">.*?<ul class="pli">.*?</ul>', new_respone, re.S)[0]

        img_url_list = re.findall(r'<li>.*?<div.*?><a href="(.*?)".*?>', img_url_temp, re.S)

        for i in range(len(img_url_list)):

            print('-' * 20 + '正在下载第%d页第%d张图片' % (page, i+1) + '-' * 20)

            img_url = self.url + img_url_list[i]

            img_respone = self.Get_Html_Respone(img_url).text

            img_respone_url = re.findall(r"</script><img.*?src='(.*?)'", img_respone)[0].replace('pre', 'pic')

            img_f_name = img_respone_url[img_respone_url.rfind('/') + 1:]

            with open('D:\Wallpaper\lamborghini\%s' % img_f_name, 'wb') as f:

                img_result = self.Get_Html_Respone(img_respone_url).content

                f.write(img_result)

            with open('C:\\Users\Administrator\AppData\Local\Microsoft\Windows\Themes\lamborghini.theme', 'a') as f:

                f.write('\n')

                f.write('Item%dPath=D:\Wallpaper\lamborghini\%s' % (i, img_f_name))

if __name__ == '__main__':

    search_name = u'兰博基尼'

    a = Ivsky_Spider(search_name)

    a.Spider()

Spider-Python实战之通过Python爬虫爬取图片制作Win7跑车主题的更多相关文章

孤荷凌寒自学python第八十一天学习爬取图片1
孤荷凌寒自学python第八十一天学习爬取图片1 (完整学习过程屏幕记录视频地址在文末) 通过前面十天的学习,我已经基本了解了通过requests模块来与网站服务器进行交互的方法,也知道了Beauti ...
[python爬虫] 爬取图片无法打开或已损坏的简单探讨
本文主要针对python使用urlretrieve或urlopen下载百度.搜狗.googto(谷歌镜像)等图片时,出现"无法打开图片或已损坏"的问题,作者对它进行简单的探讨.同时 ...
利用python爬虫爬取图片并且制作马赛克拼图
想在妹子生日送妹子一张用零食(或者食物类好看的图片)拼成的马赛克拼图,因此探索了一番= =. 首先需要一个软件来制作马赛克拼图,这里使用Foto-Mosaik-Edda(网上也有在线制作的网站,但是我 ...
python +requests 爬虫-爬取图片并进行下载到本地
因为写12306抢票脚本需要用到爬虫技术下载验证码并进行定位点击所以这章主要讲解,爬虫,从网页上爬取图片并进行下载到本地爬虫实现方式: 1.首先选取你需要的抓取的URL:2.将这些URL放入待抓 ...
Python 爬虫爬取图片入门
爬虫网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本. 用户看到的网页实质是由 HTML 代码构成的,爬 ...
【Python实战】使用Python连接Teradata数据库？？？未完成
1.安装Python 方法详见:[Python 05]Python开发环境搭建 2.安装Teradata客户端ODBC驱动安装包地址:TTU下载地址 (1)安装TeraGSS和tdicu(ODBC依 ...
python网络爬虫&&爬取图片
爬取学院官网数据from urllib.request import * #导入所有request urllib文件夹,request只是里面的一个模块from lxml import etree # ...
python实战===一句python代码搭建FTP服务
环境搭建: python windows/linux pip install pyftpdlib (安装失败请到这里下载:https://pypi.python.org/pypi/pyftpdlib ...
python3--网络爬虫--爬取图片
网上大多爬虫仍旧是python2的urllib2写的,不过,坚持用python3(3.5以上版本可以使用异步I/O) 相信有不少人爬虫第一次爬的是Mm图,网上很多爬虫的视频教程也是爬mm图,看了某人的 ...

随机推荐

【转】Intent传递数据时，可以传递哪些类型数据？
在Android应用的开发中,如果我们需要在不同的模块(比如不同的Activity之间)之间传递数据,通常有以下两种方法:1. 利用Intent对象携带数据通过查询Intent/Bundle的API文 ...
bzoj3505 [Cqoi2014]数三角形——组合数+容斥
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3505 好题啊好题...好像还曾经出现在什么智力测试卷中来着...当时不会现在还是无法自己推出 ...
【WIP】Bootstrap modal
创建: 2017/09/28 更新: 2017/10/14 标题加上[WIP]
C语言内存管理总结
更新: 2018/01/09 增加free() 更新: 2018/04/13 修改部分文字与表格背景色与默认颜色相同 //# TODO: malloc, alloc, calloc, realloc ...
Network(Tarjan+LCA)
http://poj.org/problem?id=3417 元宵节+情人节晚上刷的题,纪念一下.. 题意:给出n个点,m条边,然后Q个询问,每次询问输入一条边,输出加入此边后桥的个数.. #incl ...
关于postman软件的安装与使用
1.这个软件是一个模拟发请求的软件 2.这个软件和这个网站的 json 格式数据有着很好的关系 https://www.json.cn/ 他能帮助我们分解代码, 3.在使用(修改的)过程中发现了一个 ...
$tsinsenA1067$
$problem$ 这种题目需要一个定理 $a[1]+a[2]+a[3]+a[4]...=(a[1]%mod)+...$ 本人出奇的懒然后动态规划?(恰似枚举) #include < ...
HTML--文本域，支持多行文本输入
当用户需要在表单中输入大段文字时,需要用到文本输入域. 语法: <textarea rows="行数" cols="列数">文本</texta ...
关于华为手机Log.d打印不出来log的问题
http://blog.csdn.net/picasso_l/article/details/52489560 拨号,进入后台设置,进行操作.
亚马逊EC2构建代理服务器心血历程
1.亚马逊上申请一台免费的EC2服务器,有相应的教程,绑定信用卡,预支付1美元,据说可以退回(防止到期后直接扣款,支付后通过修改卡信息,但好象有提示了,说卡不对了,也不管它了,到期后再说,美国人也不是 ...

Spider-Python实战之通过Python爬虫爬取图片制作Win7跑车主题

1. 前期准备

1.1 开发工具

1.2 Python库

2. 配置系统主题文件

3.获取页面地址

4.编写爬虫

Spider-Python实战之通过Python爬虫爬取图片制作Win7跑车主题的更多相关文章

随机推荐

热门专题