Python 爬虫-爬取京东手机页面的图片

具体代码如下：

__author__ = 'Fred Zhao'

import requests

from bs4 import BeautifulSoup

import os

from urllib.request import urlretrieve

class Picture():

    def __init__(self):

        self.headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36'}

        self.base_url = 'https://list.jd.com/list.html?cat=9987,653,655&page='

        self.base_path = os.path.dirname(__file__)

    def makedir(self, name):

        path = os.path.join(self.base_path, name)

        isExist = os.path.exists(path)

        if not isExist:

            os.makedirs(path)

            print("File has been created.")

        else:

            print('OK!The file is existed. You do not need create a new one.')

        os.chdir(path)

    def request(self, url):

        r = requests.get(url, headers=self.headers)

        return r

    def get_img(self, page):

        r = self.request(self.base_url + str(page))

        plist = BeautifulSoup(r.text, 'lxml').find('div', id='plist')

        item = plist.find_all('li', class_='gl-item')

        print(len(item))

        self.makedir('pictures')

        num = 0

        for i in item:

            num += 1

            imglist = i.find('div', class_='p-img')

            print(num)

            img = imglist.find('img')

            print('This is %s picture' %num)

            if img.get('src'):

                url = 'https:' + img.get('src')

                fileName = img.get('src').split('/')[-1]

                urlretrieve(url, filename=fileName)

            elif img.get('data-lazy-img'):

                url = 'https:' + img.get('data-lazy-img')

                fileName = img.get('data-lazy-img').split('/')[-1]

                urlretrieve(url, filename=fileName)

if __name__ == '__main__':

    picture = Picture()

    for i in range(2): #控制爬取的页数

        picture.get_img(i+1)

Python 爬虫-爬取京东手机页面的图片的更多相关文章

python爬虫爬取京东、淘宝、苏宁上华为P20购买评论
爬虫爬取京东.淘宝.苏宁上华为P20购买评论 1.使用软件 Anaconda3 2.代码截图三个网站代码大同小异,因此只展示一个 3.结果(部分) 京东淘宝苏宁 4.分析这三个网站上的评论数据 ...
python爬虫---爬取王者荣耀全部皮肤图片
代码: import requests json_headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win ...
Python爬虫-爬取京东商品信息-按给定关键词
目的:按给定关键词爬取京东商品信息,并保存至mongodb. 字段:title.url.store.store_url.item_id.price.comments_count.comments 工具 ...
Python爬虫爬取百度贴吧的图片
根据输入的贴吧地址,爬取想要该贴吧的图片,保存到本地文件夹,仅供参考: #!/usr/bin/python#_*_coding:utf-8_*_import urllibimport urllib2i ...
python爬虫–爬取煎蛋网妹子图片
前几天刚学了python网络编程,书里没什么实践项目,只好到网上找点东西做. 一直对爬虫很好奇,所以不妨从爬虫先入手吧. Python版本:3.6 这是我看的教程:Python - Jack -Cui ...
一个简单的定向python爬虫爬取指定页面的jpg图片
import requests as r import re resul=r.get("http://www.imooc.com/course/list") urlinfo=re. ...
python爬虫爬取煎蛋网妹子图片
import urllib.request import os def url_open(url): req = urllib.request.Request(url) req.add_header( ...
python大规模爬取京东
python大规模爬取京东主要工具 scrapy BeautifulSoup requests 分析步骤打开京东首页,输入裤子将会看到页面跳转到了这里,这就是我们要分析的起点我们可以看到这个页面 ...
Java实现爬取京东手机数据
Java实现爬取京东手机数据最近看了某马的Java爬虫视频,看完后自己上手操作了下,基本达到了爬数据的要求,HTML页面源码也刚好复习了下,之前发布两篇关于简单爬虫的文章,也刚好用得上.项目没什么太 ...

随机推荐

delphi 打印 PDevMode 说明
//PDevMode = _devicemodeW;// _devicemodeW = record// dmDeviceName: array[0..CCHDEVICENAME - 1] of Wi ...
Android中监听ListView滑动到底部
Android中的应用就是ListView中向下滑动加载更多的功能,不要再onScroll方法中进行判断,那样当滑动到底部的时候,触摸屏幕就会又去加载更多,效果很差,可以自行测试一下: listvie ...
Linux串口驱动程序(3)-打开设备
先来分析一下串口打开的过程: 1.用户调用open函数打开串口设备文件:2.在内核中通过tty子系统,把open操作层层传递到串口驱动程序中:3.在串口驱动程序中的xx_open最终实现这个操作.这里 ...
web开发调用百度地图API + AK申请
web开发调用百度地图API + AK申请要使用百度地图的API我们首先需要在我们的html页面引入js----`` 如何获取百度地图ak: 1.登陆百度地图开发者平台 2.注册百度开发者账号并登陆 ...
Access数据库中自动编号字段重置为1
在清空一张ACESS数据库表后,在重添加数据之前,希望此表的自动编号能从1开始,怎么办呢? 下面的方法告诉我们,除了通过转存数据库表的方法外,还有几种更简单的方法: 方法一(前提:数据库表可带内容进行 ...
戏说 .NET GDI+系列学习教程(三、Graphics类的应用_打印收银小票)
#region 打印 /// <summary> /// 打印字符串内容 /// </summary> /// <returns></returns> ...
改变IntelliJ IDEA 中的system和config/plugins的默认C盘的路径
1,问题,在为idea在线安装插件时,如JProfiler,会默认安装到C盘,而本人则是希望安装到软件所在的D盘目录下,那么如何修改呢: C:\Users\xxx\.IntelliJIdea\conf ...
当引入的类库存在一个类型时，提示“xxx”和“xxx”之间的不明确引用时，消除歧义的方法
//using _2_命名空间和程序集.WidgetA; //using _2_命名空间和程序集.WidgetB; using System; using System.Collections.Gen ...
linux 编译指定库、头文件的路径问题（转）
1. 为什么会出现undefined reference to 'xxxxx'错误? 首先这是链接错误,不是编译错误,也就是说如果只有这个错误,说明你的程序源码本身没有问题,是你用编译器编译时参数用得 ...
MySQL将查询结果写入到文件的2种方法
1.SELECT INTO OUTFIL: 这种方法不能覆盖或者追加到已经存在的文件,只能写入到新文件,并且建立文件的路径需要mysql进程用户有权限建立新文件. mysql 61571 60876 ...

Python 爬虫-爬取京东手机页面的图片

Python 爬虫-爬取京东手机页面的图片的更多相关文章

随机推荐

热门专题