python+requests抓取页面图片

前言：

学完requests库后，想到可以利用python+requests爬取页面图片，想到实战一下。依照现在所学只能爬取图片在html页面的而不能爬取由JavaScript生成的图片，所以我选取饿了打开下面这个页面http://p.weather.com.cn/2017/06/2720826.shtml#p=7

案例步骤：

1.利用requests库，调用requests库中的get()方法，打开需要爬去的页面url，返回页面内容，下面是自定义的打开页面的方法

def load_page(url):

    response=requests.get(url)

    data=response.content

    return data

2.用正则表达式去匹配页面的图片链接，匹配成功后，把图片下载下来，保存到对应的文件位置，下面是自定义的保存图片方法

def get_image(html):

    regx=r'http://[\S]*jpg'

    pattern=re.compile(regx)

    get_images=re.findall(pattern,repr(html))

    num=1

    for img in  get_images:

        image=load_page(img)

        with open('./spider_picture/%s.jpg' % num,'wb') as fb:

            fb.write(image)

            print("正在下载第%s张图片" %num)

            num=num+1

    print("下载完成！")

　　完整案例源码：

# coding:utf-8

# 引入requests包和正则表达式包re

import requests

import re

# 自定义下载页面函数

def load_page(url):

    response=requests.get(url)

    data=response.content

    return data

# 自定义保存页面图片函数

def get_image(html):

    regx=r'http://[\S]*jpg'  # 定义图片正则表达式

    pattern=re.compile(regx) # 编译表达式构造匹配模式

    get_images=re.findall(pattern,repr(html)) # 在页面中匹配图片链接

    num=1

    # 遍历匹配成功的链接

    for img in  get_images:

        image=load_page(img) #根据图片链接，下载图片链接

        # 将下载的图片保存到对应的文件夹中

        with open('./spider_picture/%s.jpg' % num,'wb') as fb:

            fb.write(image)

            print("正在下载第%s张图片" %num)

            num=num+1

    print("下载完成！")

# 定义爬取页面的链接

url ='http://p.weather.com.cn/2017/06/2720826.shtml#p=7'

# 调用load_page函数，下载页面内容

html = load_page(url)

# 在页面中，匹配图片链接，并将图片下载下来，保存到对应文件夹

get_image(html)

python+requests抓取页面图片的更多相关文章

python requests抓取NBA球员数据，pandas进行数据分析，echarts进行可视化 (前言)
python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言) 感觉要总结总结了,希望这次能写个系列文章分享分享心得,和大神们交流交流,提升提升. 因为 ...
python 爬虫之requests爬取页面图片的url，并将图片下载到本地
大家好我叫hardy 需求:爬取某个页面,并把该页面的图片下载到本地思考: img标签一个有多少种类型的src值?四种:1.以http开头的网络链接.2.以“//”开头网络地址.3.以“/”开头绝对 ...
Python爬虫 —— 抓取美女图片
代码如下: #coding:utf-8 # import datetime import requests import os import sys from lxml import etree im ...
Python爬虫 —— 抓取美女图片（Scrapy篇）
杂谈: 之前用requests模块爬取了美女图片,今天用scrapy框架实现了一遍. (图片尺度确实大了点,但老衲早已无恋红尘,权当观赏哈哈哈) Item: # -*- coding: utf-8 - ...
python实现抓取必应图片设置桌面
源码参考https://github.com/vbirds/pyWallpaper,代码风格不错本人只是将其适配到python3.5,并消除一些bug,源代码中桌面地址未使用绝对路径导致win10 ...
python requests抓取猫眼电影
1. 网址:http://maoyan.com/board/4? 2. 代码: import json from multiprocessing import Pool import requests ...
Python实现抓取页面上链接
方法一: # coding:utf-8 import re import requests # 获取网页内容 r = requests.get('http://www.163.com') data ...
Python 爬虫: 抓取花瓣网图片
接触Python也好长时间了,一直没什么机会使用,没有机会那就自己创造机会!呐,就先从爬虫开始吧,抓点美女图片下来. 废话不多说了,讲讲我是怎么做的. 1. 分析网站想要下载图片,只要知道图片的地址 ...
Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...

随机推荐

.NET WCF Return String 字符串有反斜杠的处理
应该是: {"Message":"Hello World"} 结果是:" {\"Message\":\"Hello Wo ...
sql server不用安装sql管理工具开启sa
今天无意间发现腾讯云镜像有windows server2016,追求新系统的我,马上就重装了云服务器.重装完后发现,配置太低,远程桌面都变得不是很顺畅,于是装完sql server2016后便不打算另 ...
CLR via C# 读书笔记-27.计算限制的异步操作（上篇）
前言学习这件事情是一个习惯,不能停...另外这篇已经看过两个月过去,但觉得有些事情不总结跟没做没啥区别,遂记下此文 1.CLR线程池基础 2.ThreadPool的简单使用练习 3.执行上下文 4. ...
并行架构技术 EasyMR
EasyMR简介一个并行计算软件框架基于此框架的软件可以运行在多台计算机组成的计算集群上,并且每个计算机的计算任务也是多线程方式并行进行的,对于处理复杂的业务和巨量数据时非常用于. 有着MapRe ...
scroll滚动到一定距离触发事件/返回顶部animate
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Java面试必问
1. 图灵 1.1 聊聊哈希算法与HashMap 1)一个优秀的哈希算法有什么特点? 快速.不可逆.敏感性.低碰撞性 2)自己写一个Hash算法取模 3)Java中的Hash算法 HashMap,侧 ...
linux命令提示符[root@localhost ~]#详解
[root@localhost ~]# 1. @之前代表当前登录用户在Linux中管理员用户是root,还有一些普通用户: 在此例中,root代表当前登录用户 2. @之后代表当前计算机主机 ...
[Objective-C语言教程]数据类型（5）
在Objective-C编程语言中,数据类型是指用于声明不同类型的变量或函数的扩展系统. 变量的类型决定了它在存储中占用的空间大小以及如何解释存储的位模式. Objective-C中的类型可分为以下几 ...
To 高一
Linux 坑待填 Special Judge 什么是 Special Judge?有的题目会让你输出任意一个解即可AC,或者是让你输出部分答案能取得本测试点部分得分,或者是按照方案的优秀程度给你分, ...
python super()继承和多继承
class A: def __init__(self): self.n = 2 def add(self, m): print('self is {} @A.add'.format(self)) se ...

python+requests抓取页面图片

前言：

案例步骤：

完整案例源码：

python+requests抓取页面图片的更多相关文章

随机推荐

热门专题

　　完整案例源码：