python 爬取淘宝的模特照片

前段时间花了一部分时间学习下正则表达式，总觉得利用正则要做点什么事情，所以想通过爬取页面的方式把一些美女的照片保存下来，其实过程很简单。

1.首先读取页面信息；

2.过滤出来照片的url地址；

3.通过URL地址来保存图片；

#-*-coding:utf-8 -*-

'''爬取评论区的美女照片'''

import requests

import re

RE_PICTURE_NAME = re.compile(r'(\w)+\.[A-Za-z]+$')

RE_URL = re.compile(r'(\w)+\.(\w)+\.(\w)+/(\w)+\/(\w){2,}\/(\w)+.jpg')

request_top_list = requests.get('https://mm.taobao.com/json/request_top_list.htm')

RESPONSE = request_top_list.text #resp.text返回的是Unicode型的数据

def Get_Reuest_Picture_List(RESPONSE):

    '''抓取页面的所有URL'''

    URLS = []

    for match in RE_URL.finditer(RESPONSE): #所有与pattern相匹配的全部字串，以迭代器的形式返回 与findall的区别,findall在字符串中找到正则表达式所匹配的所有子串，并组成一个列表返回

        URL = match.group()

        URLS.append('http://'+URL)

    return URLS

def Download_Url_Picture(URL):

    '''下载图片'''

    REQUEST_CONTENT = requests.get(URL).content #resp.content返回的是bytes型也就是二进制的数据

    PICTURE_NAME = RE_PICTURE_NAME.search(URL).group(0) #根据url获取图片名字

    FILE_OBJECT = open(str(PICTURE_NAME),'wb') #以二进制的方式写文件

    FILE_OBJECT.write('picture\\'+REQUEST_CONTENT)

    FILE_OBJECT.close()

def Save_All_Picture(URLS):

    '''保存所有请求中的图片'''

    for URL in URLS:

        Download_Url_Picture(URL)

if __name__ == '__main__':

    URLS = Get_Reuest_Picture_List(RESPONSE)

    Save_All_Picture(URLS)

python 爬取淘宝的模特照片的更多相关文章

Python 爬取淘宝商品数据挖掘分析实战
Python 爬取淘宝商品数据挖掘分析实战项目内容本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 爬取淘宝商品 ...
使用Python爬取淘宝两千款套套
各位同学们,好久没写原创技术文章了,最近有些忙,所以进度很慢,给大家道个歉. 警告:本教程仅用作学习交流,请勿用作商业盈利,违者后果自负!如本文有侵犯任何组织集团公司的隐私或利益,请告知联系猪哥删除! ...
甜咸粽子党大战，Python爬取淘宝上的粽子数据并进行分析
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 爬虫爬取淘宝数据,本次采用的方法是:Selenium控制Chrome浏览 ...
Python爬取淘宝店铺和评论
1 安装开发需要的一些库 (1) 安装mysql 的驱动:在Windows上按win+r输入cmd打开命令行,输入命令pip install pymysql,回车即可. (2) 安装自动化测试的驱动s ...
【Python爬虫案例学习】Python爬取淘宝店铺和评论
安装开发需要的一些库 (1) 安装mysql 的驱动:在Windows上按win+r输入cmd打开命令行,输入命令pip install pymysql,回车即可. (2) 安装自动化测试的驱动sel ...
一篇文章教会你用Python爬取淘宝评论数据（写在记事本）
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. 很多人学习python,不知道从何学起.很多人学习python,掌握了 ...
【Python爬虫案例学习】python爬取淘宝里的手机报价并以价格排序
第一步: 先分析这个url,"?"后面的都是它的关键字,requests中get函数的关键字的参数是params,post函数的关键字参数是data, 关键字用字典的形式传进去,这 ...
python爬取淘宝排名
import timeimport jsonimport requestsimport xlrdimport randomimport os from xlutils.copy import copy ...
Python 爬取淘宝商品信息和相应价格
!只用于学习用途! plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html) :获得商品价格和view_pri ...

随机推荐

推荐virtualBox虚拟机及安装使用的注意事项
推荐选择virtualBox虚拟机选择vbox是因为,本人觉得使用起来比VMware要方便. 简要说明: 本人自学前端开发,对于linux了解很少,直接上手真实的linux环境会很不适应,所以选择了 ...
老李分享：并行计算基础&编程模型与工具
在当前计算机应用中,对高速并行计算的需求是广泛的,归纳起来,主要有三种类型的应用需求: 计算密集(Computer-Intensive)型应用,如大型科学工程计算与数值模拟: 数据密集(Data-In ...
6.Redis常用命令：Set
在Redis中,我们可以将Set类型看作为没有排序的字符集合,和List类型一样,我们也可以在该类型的数据值上执行添加.删除或判断某一元素是否存在等操作.需要说明的是,这些操作的时间复杂度为O(1), ...
《JavaScript程序设计》第2课：JS类型系统
JS类型系统可以分为标准类型和对象类型,进一步标准类型又可以分为原始类型和引用类型,而对象类型又可以分为内置对象类型.普通对象类型.自定义对象类型. 1. 标准类型标准类型共包括了6个分别是:und ...
salesforce 零基础学习（六十九）当新增/修改一条记录以后发生了什么（适合初学者）
salesforce开发中,我们会对object进行很多的操作,比如对object设置字段的必填性唯一性等,设置validation rule实现一下相关的字段的逻辑校验,设置workflow实现某个 ...
Java ---自定义标签（二）
上篇文章的最后,我们自定义了一个带属性的标签,并使用它完成了一个简单的案例.其实到这我们已经可以看出来,前端jsp页面只需要写一个类似html语法的标签,就可以完成将集合中的数据取出来并展示这么相对复 ...
Linux-配置vim开发环境
vim是一个类似于vi的著名的功能强大.高度可定制的文本编辑器,在vi的基础上改进和增加了很多特性.vim是纯粹的自由软件. 为了满足使用者的要求,将vim界面配置为自己想要的界面类型也变得流行起来. ...
Elasticsearch - 快速入门
Elasticsearch是基于Apache 2.0开源的实时.分布式.分析搜索引擎,相比Lucene,Elasticsearch的上手比较容易,这篇文章主要纪录Elasticsearch的基本概念和 ...
JavaScript获取html元素的实际宽度和高度
一.JavaScript获取html元素宽高 1.宽高都写在样式表里,就比如#div1{width:120px;}.这中情况通过#div1.style.width拿不到宽度,而通过#div1.offs ...
javaEE-string家族三大流氓
最近学习到StringBuffer,心中有好些疑问,搜索了一些关于String,StringBuffer,StringBuilder的东西,现在整理一下. 关于这三个类在字符串处理中的位置不言而喻,那 ...

python 爬取淘宝的模特照片

python 爬取淘宝的模特照片的更多相关文章

随机推荐

热门专题