一：简介

通过selenium模块，模拟火狐浏览器进行搜索下载操作。

二：脚本内容

# -*- coding:utf-8 -*-

# 百度图片自动爬去

# Chrome浏览器类似，设置其options：

# download.default_directory：设置下载路径

# profile.default_content_settings.popups：设置为 0 禁止弹出窗口

import time

from selenium import webdriver

# 创建一个浏览器的profile文件

profile = webdriver.FirefoxProfile()

# 指定下载路径

profile.set_preference('browser.download.dir',"D:\\images")

# 设置成 2 表示使用自定义下载路径；设置成 0 表示下载到桌面；设置成 1 表示下载到默认路径

profile.set_preference('browser.download.folderList', 2)

# 是否弹出下载管理器

profile.set_preference('browser.download.manager.showWhenStarting', False)

# 指定下载文件的数据类型

profile.set_preference('browser.helperApps.neverAsk.saveToDisk','image/jpeg, image/png')

# 打开火狐浏览器，并指定profile文件

firfox = webdriver.Firefox(firefox_profile=profile)

# 访问百度

firfox.get("http://www.baidu.com")

# 清除百度搜索框，元素id为f12查看

firfox.find_element_by_id("kw").clear()

# 发送内容到搜索框

firfox.find_element_by_id("kw").send_keys(u"美女")

time.sleep(2)

# 点击百度一下按钮

firfox.find_element_by_id("su").click()

time.sleep(5)

# 对当前页面进行定位（不一定生效）

firfox.current_window_handle

# 根据xpath定位

firfox.find_element_by_xpath("//*[@id=\"s_tab\"]/a[5]").click()

time.sleep(3)

firfox.current_window_handle

# 根据xpath定位

firfox.find_element_by_xpath("//*[@id=\"imgid\"]/div/ul/li[1]/div[1]/a/img").click()

time.sleep(3)

# 加载当前页面的元素

firfox.switch_to_window(firfox.window_handles[1])

while True:

    #firfox.find_element_by_xpath("//html/body/div[1]/div[2]/div/div[2]/div/div[1]/span[7]").click()

    # 根据class进行定位，也就是点击下载按钮

    firfox.find_element_by_class_name(r"bar-btn.btn-download").click()

    time.sleep(10)

    # 切换图片

    firfox.find_element_by_xpath("//*[@id=\"container\"]/span[2]").click()

    time.sleep(10)

firfox.quit()

selenium爬取百度图片的更多相关文章

selenium+chrome浏览器驱动-爬取百度图片
百度图片网页中中,当页面滚动到底部,页面会加载新的内容. 我们通过selenium和谷歌浏览器驱动,执行js,是浏览器不断加载页面,通过抓取页面的图片路径来下载图片. from selenium im ...
百度图片爬虫-python版-如何爬取百度图片?
上一篇我写了如何爬取百度网盘的爬虫,在这里还是重温一下,把链接附上: http://www.cnblogs.com/huangxie/p/5473273.html 这一篇我想写写如何爬取百度图片的爬虫 ...
python 3 爬取百度图片
python 3 爬取百度图片学习了:https://blog.csdn.net/X_JS612/article/details/78149627
Python 爬虫实例（1）—— 爬取百度图片
爬取百度图片在Python 2.7上运行 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Author: loveNight import jso ...
python爬虫-爬取百度图片
python爬虫-爬取百度图片(转) #!/usr/bin/python# coding=utf-8# 作者 :Y0010026# 创建时间 :2018/12/16 16:16# 文件 :spider ...
python 利用selenium爬取百度文库的word文章
今天学习如何使用selenium库来爬取百度文库里面的收费的word文档 from selenium import webdriver from selenium.webdriver.common.k ...
Python爬虫：通过关键字爬取百度图片
使用工具:Python2.7 点我下载 scrapy框架 sublime text3 一.搭建python(Windows版本) 1.安装python2.7 ---然后在cmd当中输入python,界 ...
python爬虫之爬取百度图片
##author:wuhao##爬取指定页码的图片,如果需要爬取某一类的所有图片,整体框架不变,但需要另作分析#import urllib.requestimport urllib.parseimpo ...
Java爬取百度图片Google图片Bing图片
先看看抓取的结果. 8个Java类: Startup.java - main函数 ImageCrawler.java - Crawler基类 BaiduImageCrawler.java - 百度图片 ...

随机推荐

C语言之scanf
#include<stdio.h>int main(){int num;int a,b,c,result,d,result1;scanf("int%d",&nu ...
爬起点小说 day01
先介绍下我自己爬起点小说的思路: 1.爬取所有的类型列表 a.链接存redis中类型表:novel_list 具体每一种类型:bnovel_all_list(把novel_list和bnovel_l ...
Zabbix 3.0 部署监控 [二]
一.添加监控主机及设置 1.创建主机 Agent可以干一些SNMP无法干的事情,例如自定义监控项 snmp相关文章:http://www.abcdocker.com/abcdocker/1376 ...
Shell中处理方法返回值问题
同步发表:http://blog.hacktons.cn/2017/12/13/shell-func-return/ 背景通过shell编程,写一些工具批处理的时候,经常需要自定义函数.更复杂点的情 ...
GDAL编译
使用cmd命令行编译 1.首先在“开始菜单\所有程序\Microsoft Visual Studio 2008\Visual Studio Tools\ Visual Studio 2008命令提示” ...
django同时查询两张表的数据，合并检索对象返回
原始需求: 1.一篇文章内容分N个版块,每篇文章的版块数量不同. 2.有个文章搜索功能,需要同时搜索标题和内容. 实现思路: 1.由于每篇文章的内容版块数量不同,因此将每个文章的标题和内容分开存入2张 ...
IE CSS Bugs 列表和解决方法
我们在开发中我们常会在IE中遇到很多莫名的bug,尤其是老态龙钟的IE6浏览器.为了提高我们的开发效率,需要经常总结,整理工作中遇到的问题.我们在网络上找到的IE Bugs 资料是零散的.不过,在老外 ...
不用分支语句实现1+2+。。。+n
要求: 不使用乘除法.for.while .if.else.switch.case.以及A?B:C三元表达式求1+2+3+...+n 此题思路有多种,能够用多态.构造函数.递归.和模板元. 我在看到 ...
星云測试- Android应用深度体检专业平台
星云測试-给你的Android应用做个深度体检星云測试- Android应用深度体检专业平台星云在线云測试(简称星云測试www.teststars.cc)是全球第一个公布并商用的数字化精准软件 ...
ShuffleNet总结
在2017年末,Face++发了一篇论文ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devic ...

selenium爬取百度图片

一：简介

二：脚本内容

selenium爬取百度图片的更多相关文章

随机推荐

热门专题