python如何使用request爬取图片

下面是代码的简单实现，变量名和方法都是跑起来就行，没有整理，有需要的可以自己整理下：

image2local:

import requests

import time

from lxml import etree

import os

#存储位置

dir = 'xxxxxx'

#网址地址

image_host = 'https://www.27270.com'

#获取爬取列表

def get_list(page_detail=''):

    #爬取列表

    page = requests.get('https://www.27270.com/ent/meinvtupian/list_11_{0}.html'.format(page_detail))

    #解析列表数据

    image_urls = etree.HTML(page.text)

    print(image_urls.xpath('/html/body/div[2]/div[7]/ul/li/a[2]/@href'))

    pages = image_urls.xpath('/html/body/div[2]/div[7]/ul/li/a[2]/@href')

    return pages

def getEntityUrl(url):

    #爬取传过来的地址

    page = requests.get(image_host+url)

    page.keep_alive = False

    image_urls = etree.HTML(page.content)

    try:

        image = image_urls.xpath('//*[@id="picBody"]/p/a[1]/img/@src')[0]

        next = image_urls.xpath('//*[@id="nl"]/a/@href')[0]

        title = image_urls.xpath('/html/body/div[2]/div[2]/h1/text()')[0]

    except:

        return False

    #爬取第一张

    if next.find('##')>1:

        return False

    else:

        result = image2local(image,title,next)

    return True

#爬取图片

def image2local(url,title,name):

    title = title.split('(')[0]

    if not os.path.exists(dir + title):

        os.mkdir(dir + title)

    try:

        image = requests.get(url)

    except:

        return True

    # print(image.content+)

    with open(dir + title+'/{0}.jpg'.format(name),'wb') as f:

        f.write(image.content)

        f.close()

    return True

if __name__ == '__main__':

    x = range(1,215)

    for i in x:

        list = get_list(i)

        for image in list:

            num = 1

            result = True

            while result:

                next = image.replace('.','_{0}'.format(num)+'.')

                num = num+1

                result = getEntityUrl(next)

python代码是现学现写的，大家勿喷

python如何使用request爬取图片的更多相关文章

Python从网页上爬取图片
在搜索壁纸的时候,想把壁纸保存到本地,一张一张的保存太过麻烦,所以想到用Python来爬取壁纸. 设计思路: 1.首先先去找有壁纸的网页: http://www.acfun.cn/a/ac334521 ...
Python爬虫学习 - day1 - 爬取图片
利用Python完成简单的图片爬取最近学习到了爬虫,瞬时觉得很高大上,想取什么就取什么,感觉要上天.这里分享一个简单的爬取汽车之家文章列表的图片教程,供大家学习. 需要的知识点储备本次爬虫脚本依赖 ...
python爬虫---scrapy框架爬取图片,scrapy手动发送请求,发送post请求,提升爬取效率,请求传参(meta),五大核心组件,中间件
# settings 配置 UA USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, l ...
python网络爬虫之爬取图片
今天使用requests和BeautifulSoup爬取了一些图片,还是很有成就感的,注释可能有误,希望大家多提意见: 方法一:requests import requests from bs4 im ...
PYTHON 利用ImagePipeline专门爬取图片
自定义file_path()函数,即可以原有图像文件名为名来保存,并分类保存 def file_path(self, request, response=None, info=None): image ...
[python爬虫] 爬取图片无法打开或已损坏的简单探讨
本文主要针对python使用urlretrieve或urlopen下载百度.搜狗.googto(谷歌镜像)等图片时,出现"无法打开图片或已损坏"的问题,作者对它进行简单的探讨.同时 ...
孤荷凌寒自学python第八十二天学习爬取图片2
孤荷凌寒自学python第八十二天学习爬取图片2 (完整学习过程屏幕记录视频地址在文末) 今天在昨天基本尝试成功的基础上,继续完善了文字和图片的同时爬取并存放在word文档中. 一.我准备爬取一个有文 ...
孤荷凌寒自学python第八十一天学习爬取图片1
孤荷凌寒自学python第八十一天学习爬取图片1 (完整学习过程屏幕记录视频地址在文末) 通过前面十天的学习,我已经基本了解了通过requests模块来与网站服务器进行交互的方法,也知道了Beauti ...
爬取图片过程遇到的ValueError: Missing scheme in request url: h 报错与解决方法
一 .scrapy整体框架 1.1 scrapy框架图 1.2 scrapy框架各结构解析 item:保存抓取的内容 spider:定义抓取内容的规则,也是我们主要编辑的文件 pipelines:管道 ...

随机推荐

supervisor的command执行两条命令
如下supervisor的进程的comand配置参数只能写一个命令 1.要执行多条命令,可以写个sh文件包含多条命令,然后sh -x xxxx.sh,但这样又多了一个文件, 2.把所有命令放在字符 ...
H5 （webApi）接口帮助文档
只有你想不到,没有找不到的,强大的 webApis!!! https://developer.mozilla.org/en-US/docs/Web/API
Linux内核之旅
http://www.kerneltravel.net/ Linux内核之旅 Linux Kernel Travel
Linux设备驱动剖析之Input（二）
分别是总线类型.厂商号.产品号和版本号. 1156行,evbit,设备支持的事件类型的位图,每一位代表一种事件,比如EV_KEY.EV_REL事件等等.BITS_TO_LONGS(nr)是一个宏,假设 ...
Linux Platform驱动模型(一) _设备信息
我在Linux字符设备驱动框架一文中简单介绍了Linux字符设备编程模型,在那个模型中,只要应用程序open()了相应的设备文件,就可以使用ioctl通过驱动程序来控制我们的硬件,这种模型直观,但是从 ...
StrokesPlus 谷歌搜索结果转https
StrokesPlus 谷歌搜索结果转https 亲测ie11可用 --清空剪切板 acSetClipboardText('') acSendKeys("^l") --选中地址栏 ...
linux如何安装多个jdk？
1 官网下载JDK版本 jdk-8u181-linux-x64.tar.gz 2 利用ssh工具上传安装包到Linux系统传至:/usr/local 3 Linux用户安装的程序一般放在 /usr/ ...
1. Mysql数据库的安装
1. Mysql数据库的安装 (1)打开Mysql安装软件,同意相关协议进入下一步安装,在选择安装类型中选择[自定义]进入下一步安装. (2)选择安装的组件信息. (3)服务器软件安装目录 (4)数据 ...
Java NIO学习笔记---I/O与NIO概述
文章目录: 1.什么是IO 2.什么是Java NIO 3.I/O常见概念 4.为什么使用NIO 5.IO VS NIO 一.什么是IO I/O 或者输入/输出 , 指的是计算机与外部世界或者一个程序 ...
python 闭包用法
def make_addr(addend): def addr(augend): return augend + addend return addr p = make_addr(23) q = ma ...

python如何使用request爬取图片

python如何使用request爬取图片的更多相关文章

随机推荐

热门专题