1.准备

各位绅士们，你可能会觉得疫情在家无聊，那么现在我们的Python语言可以满足你们的需求。
项目需要的工具
（1）Python3
（2）requests库
requests库可以通过代码pip install requests安装。如果不会用pip，可以参考以下网址i:https://jingyan.baidu.com/article/466506583fec5af549e5f825.html

2. 项目内容

2.1 网页分析

你打开以下网址：https://www.vmgirls.com/

推荐用Google浏览器。打开网址之后。

（1）右键点击检查，然后会出现HTML代码。网页链接再这里的href标签，并且是用.jpeg结尾的。

相信你也可以找链接。找到之后记住这个标签的格式。

2.2 代码结构

之前我们已经对网页进行分析，而且锁定了我们想要在网页中提取的信息（图片）所在的位置，那么下一步我们可以用Python写一个简单的代码了。最后我会给出完整代码。
（1）代码结构设计
我们的代码可以实现，链接得到网页源码、解析源码得到图片、保存图片。
结构如下：

m = Meizi(url, kv)#建立类

m.getHtml()

m.Parase(html)

m.Saveing(urls)

print('succ')

（2）导入库

import requests

import re

import time

（3）获取网页HTML

 def getHtml(self):

       try:

        response = requests.get(self.url,headers=self.kvs,timeout = 30)

        response.encoding = response.apparent_encoding

        response.raise_for_status

        html = response.text

        self.Parase(html)

       except:

          print("ERROR!")

（4）解析HTML

def Parase(self,html):

        urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)

        print(urls)

        self.Saveing(urls)

（5）保存为图片文件

   def Saveing(self,urls):

       for url in urls:

         time.sleep(1)

         file_name = url.split('/')[-1]

         response = requests.get(url,headers=kv)

         with open(file_name,'wb') as f:

             f.write(response.content)

3. 结尾（附完整代码）

这个简单项目已经结束了，你可以快速下载图片了。不过要提醒下，如果爬取太频繁，可能会被封锁ip，到时候你就无法访问这个网站了，所以建议要适当爬取，不能给网站索取太多，这样对双方都好。
代码如下：

import requests

import re

import time

class Meizi:

    def __init__(self,urls,kv):

        self.url = urls

        self.kvs = kv

    def getHtml(self):

       try:

        response = requests.get(self.url,headers=self.kvs,timeout = 30)

        response.encoding = response.apparent_encoding

        response.raise_for_status

        html = response.text

        self.Parase(html)

       except:

          print("ERROR!")

    def Parase(self,html):

        urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)

        print(urls)

        self.Saveing(urls)

    def Saveing(self,urls):

       for url in urls:

         time.sleep(1)

         file_name = url.split('/')[-1]

         response = requests.get(url,headers=kv)

         with open(file_name,'wb') as f:

             f.write(response.content)

url='https://www.vmgirls.com/13333.html'#这里的端口号13333可以调整，调整后就是不同的妹子。

kv={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'}

m = Meizi(url, kv)

m.getHtml()

print('succ')

Python爬取养眼图片的更多相关文章

用python爬取全网妹子图片【附源码笔记】
这是晚上没事无聊写的python爬虫小程序,专门爬取妹子图的,养眼用的,嘻嘻!身为程序狗只会这个了! 废话不多说,代码附上,仅供参考学习! """ 功能:爬取妹子图全网妹 ...
使用python爬取P站图片
刚开学时有一段时间周末没事,于是经常在P站的特辑里收图,但是P站加载图片的速度比较感人,觉得自己身为计算机专业,怎么可以做一张张图慢慢下这么low的事,而且这样效率的确也太低了,于是就想写个程序来帮我 ...
python爬取基础网页图片
python基础爬虫总结 1.爬取信息原理与浏览器客户端类似,向网站的服务器发送一个请求,该请求一般是url,也就是网址.之后服务器响应一个html页面给客户端,当然也有其他数据类型的信息,这些就是 ...
python 爬取知乎图片
先上完整代码 import requests import time import datetime import os import json import uuid from pyquery im ...
Python爬取全站妹子图片，差点硬盘走火了！
在这严寒的冬日,为了点燃我们的热情,今天小编可是给大家带来了偷偷收藏了很久的好东西.大家要注意点哈,我第一次使用的时候,大意导致差点坏了大事哈! 1.所需库安装 2.网站分析首先打开妹子图的官网(m ...
python爬取煎蛋图片
py2版本: #-*- coding:utf-8 -*- #from __future__ import unicode_liter import urllib,urllib2,time import ...
python爬取今日头条图片
import requests from urllib.parse import urlencode from requests import codes import os # qianxiao99 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
python 爬虫入门----案例爬取上海租房图片
前言对于一个net开发这爬虫真真的以前没有写过.这段时间学习python爬虫,今天周末无聊写了一段代码爬取上海租房图片,其实很简短就是利用爬虫的第三方库Requests与BeautifulSoup. ...

随机推荐

Contest 153
2019-09-14 23:16:25 总体感受:节奏尚可,难度尚可.然而还是卡在了最后一题,完全没有想到使用dp. 注意点: 1)Contest的最后一题往往是DP,Graph,这个敏感度需要提高: ...
java基本数据类型和引用数据类型的调用传递的区别
(1)基本数据类型:就是进行了值的传递把一份数据拷贝了之后传递过去 (2)引用数据类型:实际上也是进行了数据拷贝然后传过去,实际上也是值传递,只不过传递过去的值和原有的值指向了同一个对象所以在调用的 ...
CodeForces - 1244D 树（一条链）的染色
题意:给一个无向的无环的树,需要用三种颜色将他染色,相邻的三个点不能有重复的颜色.给出每个点染成每种颜色的花费,求最小的染色花费,如果给的图不能按要求染色,输出-1. 思路:只有三种颜色,相邻三个点还 ...
arcgis连接oracle发布服务，提示数据未注册到服务器，手动注册服务器失败
arcgis连接oracle数据库发布服务时候,分析之后提示:数据未注册到服务器上. 手动注册之后提示:数据客户端没有正确配置.实际上数据库客户端已经安装完成也可以使用. 设置 PATH 环境变量(仅 ...
coding++：使用 javascript 在html中获取url参数
函数处理定义如下: < script type = "text/javascript" > function $G() { var Url = top.window.l ...
Springboot使用自定义注解实现简单参数加密解密(注解+HandlerMethodArgumentResolver)
前言我黄汉三又回来了,快半年没更新博客了,这半年来的经历实属不易,疫情当头,本人实习的公司没有跟员工共患难, 直接辞掉了很多人.作为一个实习生,本人也被无情开除了.所以本人又得重新准备找工作了. 算 ...
gunicorn的作用
gunicorn是什么: gunicorn是一种unix上被广泛使用的Python WSGI UNIX HTTP Server WSGI是什么: 先说下 WSGI 的表面意思,Web Server G ...
CentOS下的Docker-Compose离线安装
公司服务器已经安装了 Docker 环境,但没有安装 Docker Compose,使用起来十分不便.由于服务无法连接外网,下面演示如何离线安装 Docker Compose. (1)首先访问 doc ...
css中（单冒号）：after和（双冒号）：：after的区别
:after是伪元素 .::after是伪类什么是伪类? CSS伪类是添加到选择器的关键字,指定要选择的元素的特殊状态.例如,:hover可被用于在用户将鼠标悬停在按钮上时改变按钮的颜色. ::af ...
1045 Favorite Color Stripe (30分)(简单dp)
Eva is trying to make her own color stripe out of a given one. She would like to keep only her favor ...

Python爬取养眼图片