python 爬站长素材网页图片

一、我们要用python第三方库：

import requests

import re

二、找到自己感兴趣的网页图片：

for i in range(1,2):

    url = "https://sc.chinaz.com/tupian/index.html"  # 网站地址

    if i ==1:

        url = "https://sc.chinaz.com/tupian/index.html"#网站地址

    else:

        url = "https://sc.chinaz.com/tupian/index_%s.html" %i

res = requests.get(url)

    res.encoding = res.apparent_encoding# 自适应字符编码设置

三、用正则表达式提取面每个页面图片对应的详情页的地址

获取图片地址和图片名字
res_url_i=re.findall('<img src2="(.*?)" alt=".*?">',res.text)

    res_url_name = re.findall('<img src2=".*?" alt="(.*?)">',res.text)

四、我们在压缩下载

    for res_url_i1, res_url_name1 in zip(res_url_i, res_url_name):

        res_url_i = "https:" + res_url_i1

        image_url = requests.get(res_url_i)

        f = open("./111/%s.jpg"%res_url_name1,"wb")

        print("%s.jpg" % res_url_name1 + "下载成功！！！")

        f.write(image_url.content)

        f.close()

完整代码如下：

import requests

import re

# 循环爬取前2页的页面

for i in range(1,2):

    url = "https://sc.chinaz.com/tupian/index.html"  # 网站地址

    if i ==1:

        url = "https://sc.chinaz.com/tupian/index.html"#网站地址

    else:

        url = "https://sc.chinaz.com/tupian/index_%s.html" %i

    #     #获取页面

    res = requests.get(url)

    res.encoding = res.apparent_encoding# 自适应字符编码设置

    #     提取页面中每个图片对应的详情页的地址    正则  列表

    res_url_i=re.findall('<img src2="(.*?)" alt=".*?">',res.text)

    res_url_name = re.findall('<img src2=".*?" alt="(.*?)">',res.text)

    for res_url_i1, res_url_name1 in zip(res_url_i, res_url_name):

        res_url_i = "https:" + res_url_i1

        image_url = requests.get(res_url_i)

        f = open("./111/%s.jpg"%res_url_name1,"wb")

        print("%s.jpg" % res_url_name1 + "下载成功！！！")

        f.write(image_url.content)

        f.close()

提示：

每个网页地址不一样，正则表达式也不一样，文件操作地址也不一样，我的仅供参考，不要完成相信

python 爬站长素材网页图片的更多相关文章

python爬取基础网页图片
python基础爬虫总结 1.爬取信息原理与浏览器客户端类似,向网站的服务器发送一个请求,该请求一般是url,也就是网址.之后服务器响应一个html页面给客户端,当然也有其他数据类型的信息,这些就是 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
Python 爬取单个网页所需要加载的地址和CSS、JS文件地址
Python 爬取单个网页所需要加载的URL地址和CSS.JS文件地址通过学习Python爬虫,知道根据正式表达式匹配查找到所需要的内容(标题.图片.文章等等).而我从测试的角度去使用Python爬 ...
使用python爬取P站图片
刚开学时有一段时间周末没事,于是经常在P站的特辑里收图,但是P站加载图片的速度比较感人,觉得自己身为计算机专业,怎么可以做一张张图慢慢下这么low的事,而且这样效率的确也太低了,于是就想写个程序来帮我 ...
Python爬取养眼图片
1.准备各位绅士们,你可能会觉得疫情在家无聊,那么现在我们的Python语言可以满足你们的需求.项目需要的工具(1)Python3(2)requests库requests库可以通过代码pip ins ...
python 爬取知乎图片
先上完整代码 import requests import time import datetime import os import json import uuid from pyquery im ...
Python爬取全站妹子图片，差点硬盘走火了！
在这严寒的冬日,为了点燃我们的热情,今天小编可是给大家带来了偷偷收藏了很久的好东西.大家要注意点哈,我第一次使用的时候,大意导致差点坏了大事哈! 1.所需库安装 2.网站分析首先打开妹子图的官网(m ...
用python爬取全网妹子图片【附源码笔记】
这是晚上没事无聊写的python爬虫小程序,专门爬取妹子图的,养眼用的,嘻嘻!身为程序狗只会这个了! 废话不多说,代码附上,仅供参考学习! """ 功能:爬取妹子图全网妹 ...
python爬取动态网页数据，详解
原理:动态网页,即用js代码实现动态加载数据,就是可以根据用户的行为,自动访问服务器请求数据,重点就是:请求数据,那么怎么用python获取这个数据了? 浏览器请求数据方式:浏览器向服务器的api(例 ...

随机推荐

老杜ＭySql——34道作业题
老杜MySql链接:https://www.bilibili.com/video/BV1Vy4y1z7EX?p=132 本次随笔主要来源于老杜MySql讲解视频后面的作业题,加上个人的一些理解,以及整 ...
驱动开发：内核通过PEB得到进程参数
PEB结构(Process Envirorment Block Structure)其中文名是进程环境块信息,进程环境块内部包含了进程运行的详细参数信息,每一个进程在运行后都会存在一个特有的PEB结构 ...
JavaWeb完整案例详细步骤
JavaWeb完整案例详细步骤废话少说,展示完整案例代码的业务逻辑图主要实现功能基本的CURD.分页查询.条件查询.批量删除所使用的技术前端:Vue+Ajax+Elememt-ui 后端: ...
dotnet 用 SourceGenerator 源代码生成技术实现中文编程语言
相信有很多伙伴都很喜欢自己造编程语言,在有现代的很多工具链的帮助下,实现一门编程语言,似乎已不是一件十分困难的事情.我利用 SourceGenerator 源代码生成技术实现了一个简易的中文编程语言, ...
C++之值传递&指针传递&引用传递详解
C++之值传递&指针传递&引用传递详解目录 C++之值传递&指针传递&引用传递详解 1.函数基础 2.值传递 3.指针传递 4.引用传递 1.函数基础一个函数由以下 ...
Sublime Text4(Build 4126) 安装备忘
Sublime Text4(Build 4126) 安装备忘 sublime text 4126 PJ已测可用打开浏览器进入网站https://hexed.it 打开sublime text4安装目 ...
前后端分离项目(十):实现"改"功能(前后端)
好家伙,本篇介绍如何实现"改" 我们先来看看效果吧 (这可不是假数据哟,这是真数据哟) (忘记录鼠标了,这里是点了一下刷新) First Of All 我们依旧先来理一下思路: ...
从BeanFactory源码看Bean的生命周期
下图是我搜索"Spring Bean生命周期"找到的图片,来自文章--Spring Bean的生命周期下面,我们从AbstractAutowireCapableBeanFacto ...
「浙江理工大学ACM入队200题系列」问题 A: 零基础学C/C++34—— 3个数比较大小(冒泡排序与选择排序算法)
本题是浙江理工大学ACM入队200题第四套中的A题,同时给出了冒泡排序和选择排序算法我们先来看一下这题的题面. 由于是比较靠前的题目,这里插一句.各位新ACMer朋友们,请一定要养成仔细耐心看题的习 ...
秀++视频算法仓库-厂家对接规约V5
一.概要 (1)每个算法厂家在秀++云平台上会有一个厂商标识,譬如CS101:算法厂家可能有多个算法引擎,每个引擎有一个标识譬如Q101,引擎可以理解为一个可执行程序,可以同时分析多路算法:每个算法在 ...

python 爬站长素材网页图片

python 爬站长素材网页图片的更多相关文章

随机推荐

热门专题