python爬取站长之家植物图片

 from lxml import etree

 from urllib import request

 import urllib.parse

 import time

 import os

 def handle_request(url,page):

     if page == 1:

         url = url.format('')

     else:

         url = url.format('_'+str(page))

     headers = {

         "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"

     }

     request = urllib.request.Request(url=url,headers=headers)

     return request

 def download_img(image_src):

     dirpath = r'G:/untitled/zhiwu'

     if not os.path.exists(dirpath):

         os.mkdir(dirpath)

     # 文件名

     filename= os.path.basename(image_src)

     # 文件路径

     filepath = os.path.join(dirpath, filename)

     # 发送请求保存图片

     headers = {

         "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"

     }

     request = urllib.request.Request(url=image_src, headers=headers)

     response = urllib.request.urlopen(request)

     print(response)

     with open(filepath,'wb') as fp:

         fp.write(response.read())

 def parse_content(content):

     # 解析内容,获取图片

     tree = etree.HTML(content)

     image_list = tree.xpath('//div[@id="container"]/div/div/a/img/@src')

     for image_src1 in image_list:

         image_src = image_src1.split('/')[-1]

         download_img(image_src)

 def main():

     url = 'http://sc.chinaz.com/tupian/huadetupian{}.html'

     start_page = int(input('请输入起始页码:'))

     end_page = int(input('请输入结束页码:'))

     for page in range(start_page, end_page + 1):

         request = handle_request(url, page)

         content = urllib.request.urlopen(request).read().decode()

         parse_content(content)

         time.sleep(1)

 if __name__ == '__main__':

     main()

python爬取站长之家植物图片的更多相关文章

【python数据挖掘】批量爬取站长之家的图片
概述: 站长之家的图片爬取使用BeautifulSoup解析html 通过浏览器的形式来爬取,爬取成功后以二进制保存,保存的时候根据每一页按页存放每一页的图片第一页:http://sc.china ...
Python 爬取煎蛋网妹子图片
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2017-08-24 10:17:28 # @Author : EnderZhou (z ...
Python爬取贴吧中的图片
#看到贴吧大佬在发图,准备盗一下 #只是爬取一个帖子中的图片 1.先新建一个scrapy项目 scrapy startproject TuBaEx 2.新建一个爬虫 scrapy genspider ...
python爬取某站上海租房图片
前言对于一个net开发这爬虫真真的以前没有写过.这段时间开始学习python爬虫,今天周末无聊写了一段代码爬取上海租房图片,其实很简短就是利用爬虫的第三方库Requests与BeautifulSou ...
利用python爬取王者荣耀英雄皮肤图片
前两天看到同学用python爬下来LOL的皮肤图片,感觉挺有趣的,我也想试试,于是决定来爬一爬王者荣耀的英雄和皮肤图片. 首先,我们找到王者的官网http://pvp.qq.com/web201605 ...
python爬取妹子图全站全部图片-可自行添加-线程-进程爬取，图片去重
from bs4 import BeautifulSoupimport sys,os,requests,pymongo,timefrom lxml import etreedef get_fenlei ...
Python 爬取汽车之家口碑数据
本文仅供学习交流使用,如侵立删!联系方式见文末汽车之家口碑数据 2021.8.3 更新增加用户信息参数.认证车辆信息等 2021.3.24 更新更新最新数据接口 2020.12.25 更新添加 ...
没有内涵段子可以刷了，利用Python爬取段友之家贴吧图片和小视频(含源码)
由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不 ...
使用python爬取P站图片
刚开学时有一段时间周末没事,于是经常在P站的特辑里收图,但是P站加载图片的速度比较感人,觉得自己身为计算机专业,怎么可以做一张张图慢慢下这么low的事,而且这样效率的确也太低了,于是就想写个程序来帮我 ...

随机推荐

食物链【NOI2001】（信息学奥赛一本通 1390）
[题目描述] 动物王国中有三类动物A,B,C,这三类动物的食物链构成了有趣的环形.A吃B, B吃C,C吃A. 现有N个动物,以1-N编号.每个动物都是A,B,C中的一种,但是我们并不知道它到底是哪一种 ...
curl用法详解
前言昨天现场的浏览器崩溃了,楼主苦逼,就临时用了curl测试了下图片请求接口.今天总结下. 一.what? curl is a tool to transfer data from or to a ...
java并发编程（九）ThreadLocal & InheritableThreadLocal
参考文档: https://blog.csdn.net/u012834750/article/details/71646700 threadlocal内存泄漏:http://www.importnew ...
SQL Server表 & 存储过程创建日期查询
查询表创建时间 SELECT [name] ,create_date ,modify_date FROM sys.tables ORDER BY modify_date DESC 查下存储过程创建时间 ...
Python【每日一问】29
问: [基础题]:给一个不多于 5 位的正整数,要求:一.求它是几位数,二.逆序印出各位数字[提高题]:某个公司采用公用电话传递数据,数据是四位的整数,在传递过程中是加密的,加密规则如下:每位数字都加 ...
Delphi阿里云邮件推送【支持单一发信、邮件批量发送和获取指定条件下的发送数据】
作者QQ:(648437169) 点击下载➨Delphi阿里云邮件推送阿里云api文档 [Delphi阿里云邮件推送]支持SingleSendMail(单一发信接口). ...
.net Core MongoDB用法演示
C#驱动MongoDB的本质是将C#的操作代码转换为mongo shell,驱动的API也比较简单明了,方法名和js shell的方法名基本都保持一致,熟悉mongo shell后学习MongoDB的 ...
React实例------红绿灯
概述一个react的demo的实例,适合初学react的新手练习. 效果用webpack打包后的目录结构 index.html react的封装,复用与Java的类似,面向对象的编程思想.所以in ...
mybatis插入数据后返回自增主键ID详解
1.场景介绍: 开发过程中我们经常性的会用到许多的中间表,用于数据之间的对应和关联.这个时候我们关联最多的就是ID,我们在一张表中插入数据后级联增加到关联表中.我们熟知的mybatis在插入数据后 ...
ABP 使用cache缓存
using Abp.Application.Services.Dto; using Abp.Runtime.Caching; using Microsoft.Extensions.Configurat ...

python爬取站长之家植物图片

python爬取站长之家植物图片的更多相关文章

随机推荐

热门专题