Python 爬取妹子图(技术是无罪的)

...

import requests

from bs4 import BeautifulSoup

import os

import sys

class mzitu():

    def html(self, href):

        html = self.request(href)

        a = BeautifulSoup(html.text, 'lxml').find('h2', class_='main-title')

        title = a.get_text()

        print(u'开始保存：', title)

        path = str(title)

        self.mkdir(path)

        max_span = BeautifulSoup(html.text, 'lxml').find('div', class_='pagenavi').find_all('span')[-2].get_text()

        for page in range(1, int(max_span) + 1):

            page_url = href + '/' + str(page)

            self.img(page_url)

    def img(self, page_url):

        img_html = self.request(page_url)

        img_url = BeautifulSoup(img_html.text, 'lxml').find('div', class_='main-image').find('img')['src']

        self.save(img_url)

    def save(self, img_url):

        name = img_url[-6:-4]

        img = self.request(img_url)

        with open(name + '.jpg','ab') as f:

            f.write(img.content)

    def request(self, url):

        headers = {'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}

        content = requests.get(url, headers=headers)

        return content

    def mkdir(self, path): ##这个函数创建文件夹

        path = path.strip()

        isExists = os.path.exists(os.path.join("D:\mzitu", path))

        if not isExists:

            print(u'创建', path, u'文件夹')

            os.makedirs(os.path.join("E:\MZITU", path))

            os.chdir(os.path.join("E:\mzitu", path)) ##切换到目录

            return True

        else:

            print(u'名字叫做', path, u'的文件夹已经存在了')

            return False

Mzitu = mzitu()

Mzitu.html('http://www.mzitu.com/92251')

...

Python 爬取妹子图(技术是无罪的)的更多相关文章

Python 爬取妹子图(技术是无罪的)
... #!/usr/bin/env python import urllib.request from bs4 import BeautifulSoup def crawl(url): header ...
python爬取妹子图全站全部图片-可自行添加-线程-进程爬取，图片去重
from bs4 import BeautifulSoupimport sys,os,requests,pymongo,timefrom lxml import etreedef get_fenlei ...
Python协程爬取妹子图(内有福利，你懂得~)
项目说明: 1.项目介绍本项目使用Python提供的协程+scrapy中的选择器的使用(相当好用)实现爬取妹子图的(福利图)图片,这个学会了,某榴什么的.pow(2, 10)是吧! 2.用到的知 ...
Python3爬虫系列：理论+实验+爬取妹子图实战
Github: https://github.com/wangy8961/python3-concurrency-pics-02 ,欢迎star 爬虫系列: (1) 理论 Python3爬虫系列01 ...
python 爬取妹子
爬取妹子图片网址:https://www.mzitu.com/jiepai/ 2019-06-13 环境WIN10 1903 python 3.7.3 个人习惯先在IDLE中进行调试 import ...
Python网络爬虫 | Scrapy爬取妹子图网站全站照片
根据现有的知识,写了一个下载妹子图(meizitu.com)Scrapy脚本,把全站两万多张照片下载到了本地. 网站的分析网页的网址分析打开网站,发现网页的网址都是以 http://www.mei ...
python爬取斗图网中的 “最新套图”和“最新表情”
1.分析斗图网斗图网地址:http://www.doutula.com 网站的顶部有这两个部分: 先分析“最新套图” 发现地址栏变成了这个链接,我们在点击第二页可见,每一页的地址栏只有后面的pag ...
Python爬取斗图表情，让你成为斗图大佬
话不多说,上结果(只爬了10页内容) 上代码:(可直接运行) 用到Xpath #encoding:utf-8 # __author__ = 'donghao' # __time__ = 2018/ ...
使用requests+BeaBeautiful Soup爬取妹子图图片
1. Requests:让 HTTP 服务人类 Requests 继承了urllib2的所有特性.Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定 ...

随机推荐

服务注册中心之Eureka使用
一.Eureka基础 Eureka是Netflix开发的服务发现框架,本身是一个基于REST的服务,主要用于定位运行在AWS域中的中间层服务,以达到负载均衡和中间层服务故障转移的目的.SpringCl ...
使用CEF（一）— 起步
使用CEF(一)- 起步介绍 Chromium Embedded Framework (CEF)是个基于Google Chromium项目的开源Web browser控件,支持Windows, Li ...
Data Interoperability Tools
这里的工具貌似没有对应函数~~~
洛谷3288 SCOI2014方伯伯运椰子(分数规划+spfa)
纪念博客又一次爆炸了首先,对于本题中,我们可以发现,保证存在正整数解,就表示一定费用会降低.又因为一旦加大的流量,费用一定会变大,所以总流量一定是不变的那么我们这时候就需要考虑一个退流的过程对于 ...
Spring启动过程源码分析基本概念
Spring启动过程源码分析基本概念本文是通过AnnotationConfigApplicationContext读取配置类来一步一步去了解Spring的启动过程. 在看源码之前,我们要知道某些类的 ...
你对微信小程序的理解？优缺点？
一.是什么 2017年,微信正式推出了小程序,允许外部开发者在微信内部运行自己的代码,开展业务截至目前,小程序已经成为国内前端的一个重要业务,跟 Web 和手机 App 有着同等的重要性小程序是一 ...
change or reset WSL password
change or reset WSL password To change or reset your password, open the Linux distribution and enter ...
Sequence Model-week3编程题2-Trigger Word Detection
1. Trigger Word Detection 我们的触发词将是 "Activate.".每当它听到你说 "Activate.",它就会发出 "c ...
【Linux命令063】Linux非常简单常用的入门命令
Linux常用命令这是一篇我在公众号上发布的文章,还算较为受欢迎. 博客园这边荒废好长时间了,主要是最近一年经常撰写的文章都是Linux相关的入门文章. 不知道是否能通过博客园的首页审核. 1.cd ...
Alpha发布声明
项目内容这个作业属于哪个课程 2021春季软件工程(罗杰任健) 这个作业的要求在哪里 Alpha-发布声明我们是谁删库跑路对不队我们在做什么题士进度如何进度总览一.功能与特性 1. ...

Python 爬取妹子图(技术是无罪的)

Python 爬取妹子图(技术是无罪的)的更多相关文章

随机推荐

热门专题