scrapy批量下载图片

# -*- coding: utf-8 -*-

import scrapy

from rihan.items import RihanItem

class RihanspiderSpider(scrapy.Spider):

    name = "rihanspider"

    # allowed_domains = ["*******"]

    start_urls = [**************']

    def parse(self, response):

        # print(response.text)

        for each in response.css('.img li'):

            index_url = each.css('a::attr(href)').extract_first()

            # print(index_url)

            yield scrapy.Request(url=index_url,callback=self.parse_detail)

        next = response.xpath('//a[contains(.,"下一页")]/@href').extract_first()

        if next:

            url = response.urljoin(next)

            yield scrapy.Request(url, callback=self.parse)

    def parse_detail(self, response):

        item = RihanItem()

        image_title = response.css('.width .weizhi h1::text').extract_first()

        item['image_title'] = image_title

        for each in response.css('.content'):

            # 注意这里如果想用scrapy内置的下载图片模块,这里要用extract()而不是extract_first()

            image_url = each.css('img::attr(src)').extract()

            # print(image_url)

            item['image_url'] = image_url

            yield item

        next = response.xpath('//a[contains(.,"下一页")]/@href').extract_first()

        if next:

            next_url = response.urljoin(next)

            yield scrapy.Request(url=next_url, callback=self.parse_detail)

ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1}

IMAGES_URLS_FIELD = 'image_url'

IMAGES_STORE = r'.'

scrapy批量下载图片的更多相关文章

scrapy操作mysql/批量下载图片
1.操作mysql items.py meiju.py 3.piplines.py 4.settings.py -------------------------------------------- ...
【Python】nvshens按目录批量下载图片爬虫1.00(单线程版)
# nvshens按目录批量下载图片爬虫1.00(单线程版) from bs4 import BeautifulSoup import requests import datetime import ...
Scrapy——6 APP抓包—scrapy框架下载图片
Scrapy——6 怎样进行APP抓包 scrapy框架抓取APP豆果美食数据怎样用scrapy框架下载图片怎样用scrapy框架去下载斗鱼APP的图片? Scrapy创建下载图片常见那些问题怎 ...
python——批量下载图片
前言批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片例子 from html.parser import HTMLParser import urllib.r ...
用Scrapy爬虫下载图片(豆瓣电影图片)
用Scrapy爬虫的安装和入门教程,这里有,这篇链接的博客也是我这篇博客的基础. 其实我完全可以直接在上面那篇博客中的代码中直接加入我要下载图片的部分代码的,但是由于上述博客中的代码已运行,已爬到快九 ...
javaWeb 批量下载图片
批量下载网页图片 CreateTime--2017年9月26日15:40:43 Author:Marydon 所用技术:javascript.java 测试浏览器:chrome 开发工具:Ecli ...
C++ 根据图片url 批量下载图片
最近需要用到根据图片URL批量下载到本地的操作.查找了相关资料,记录在这儿. 1.首先在CSV文件中提取出url ifstream fin("C:\\Users\\lenovo\\Deskt ...
用python批量下载图片
一写爬虫注意事项网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...
根据url地址单个或批量下载图片
我们在java开发的时候会遇到通过url地址下载图片的情况.方便起见,我把通过url地址下载图片封装了tool工具类,方便以后使用 1.根据如:http://abc.com/hotels/a.jpg ...

随机推荐

Maven-05：插件目标
在学习插件和生命周期的绑定关系之前,必须先了解插件目标(plugin goal). 我们知道,Maven的核心仅仅定义了抽象的生命周期,具体的任务是交由插件完成的,插件以独立的构件形式存在,因此Mav ...
sentinel监控redis高可用集群（一）
一.首先配置redis的主从同步集群. 1.主库的配置文件不用修改,从库的配置文件只需增加一行,说明主库的IP端口.如果需要验证的,也要加多一行,认证密码. slaveof 192.168.20.26 ...
POJ1331 Multiply(strtol函数练习)
题目链接:http://poj.org/problem?id=1331 主要介绍strtol函数: long int strtol(const char *nptr,char **endptr,int ...
Redis 慢日志
redis的slowlog是redis用于记录记录慢查询执行时间的日志系统.由于slowlog只保存在内存中,因此slowlog的效率很高,完全不用担心会影响到redis的性能.Slowlog是Red ...
ping通但打不开网页
ping通但打不开网页网页出现: The proxy server is refusing connections Firefox is configured to use a proxy serv ...
/etc/nginx/nginx.conf配置文件详解
user nginx; #数值和cpu核数个数一致worker_processes 8; #worker与cpu绑定 worker_cpu_affinity 0001 0010 0100 1000 1 ...
lua循环，减少不必要的循环
lua中for循环的理解 for i=1, 10 do i = i+3 cclog("i=======%d",i) end 输出:4,5,6,7,8,9,10,11,12,13 相 ...
Java基础笔记（7）----三个修饰符
abstract抽象方法抽象方法:abstract修饰的方法,只有声明而没有方法的实现(连{}都没有). 语法:修饰符返回值类型方法名(形参列表); 注意:抽象方法必须定义在抽象类中. ...
HIVE的常用操作（HQL)语句
HIVE基本操作命令创建数据库 >create database db_name; >create database if not exists db_name;//创建一个不存在的数据 ...
C语言函数嵌套调用作业
一.实验作业 1.1 PTA题目:6-4 十进制转换二进制设计思路如果n大于1 对n/2继续进行该函数运算输出n%2的值代码截图调试问题我第一次做的时候判断的边界条件是大于0继续进行运算, ...

scrapy批量下载图片

scrapy批量下载图片的更多相关文章

随机推荐

热门专题