使用selenium实现站长素材图片采集

from selenium import webdriver

import requests,os

from lxml import etree

from selenium.webdriver.chrome.options import Options

from urllib import request

chrome_options = Options()

chrome_options.add_argument('--headless')

chrome_options.add_argument('--disable-gpu')   #跳过视图界面

pro = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_options)

url = "http://sc.chinaz.com/tupian/haiyangshengwutupian.html"

pro.get(url)

js = 'window.scrollTo(0,document.body.scrollHeight)'

pro.execute_script(js)

page_text = pro.page_source

tree = etree.HTML(page_text)

url_img = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/img/@src')  #获取图片url列表

names = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/@alt')   #图片名称列表

if not os.path.exists('./img'):  #生成文件夹

    os.mkdir('./img')

for index,url in enumerate(url_img):

    img_path = './img/' + names[index]+'.jpg'  #提取图片名称

    request.urlretrieve(url,img_path)

使用selenium实现站长素材图片采集的更多相关文章

3D图片采集与展示（SurfaceView 自适应 Camera, 录制视频，抽取帧）
最近在做一个3D图片采集与展示. 主要功能为:自定义Camera(google 已经摈弃了Camera, 推荐使用Camera2,后续篇幅,我将会用Camera2取代Camera),围绕一个物体360 ...
C#图片采集软件自动翻页自动分类（收集美图必备工具）（一）
网站管理员希望将别人的整站数据下载到自己的网站里或者将别人网站的一些内容保存到自己的服务器上.从内容中抽取相关的字段,发布到自己的网站系统中.有时需要将网页相关的文件也保存到本地,如图片.附件等. 图 ...
分享一组Rpg Marker人物行走,游戏素材图片，共20张图片
分享一组Rpg Marker人物行走,游戏素材图片,共20张图片上面的下载地址链接是图片,无法直接复制哦!下载请直接点击: 游戏素材下载或者复制以下链接:http://***/view/13.h ...
基于ZedBoard的Webcam设计(一)：USB摄像头(V4L2接口)的图片采集【转】
转自:http://www.cnblogs.com/surpassal/archive/2012/12/19/zed_webcam_lab1.html 一直想把USB摄像头接到Zedboard上,搭建 ...
图片采集器_PHP
现在国内模仿“pinterest”的越来越多了,之前我做过一个基于chrome浏览器上的一个“图片采集工具”,类似于“花瓣网“那样的,初期我觉得挺简单,后来做起来发现还是挺复杂的,特别是整合到你自己的 ...
php图片采集后按原路径保存图片
php图片采集后按原路径保存图片. 代码: <?php $domain ='http://www.jbxue.com'; $url = '/newskin/images/v4/logo.jpg' ...
15、USB摄像头图片采集+QT显示
一.Qt的下载和的安装关于Qt的安装,网络上有很详细的介绍.这里只做简单介绍. 需要的安装包一共有两个:Qt Creator 和QTE. 1)QT Creator 下载地址:qt-sdk-linux ...
Selenium&EmguCV实现爬虫图片识别
概述爬虫需要抓取网站价格,与一般抓取网页区别的是抓取内容是通过AJAX加载,并且价格是通过CSS背景图片显示的. 每一个数字对应一个样式,如'p_h57_5' .p_h57_5 { backgrou ...
selenium爬取百度图片
一:简介通过selenium模块,模拟火狐浏览器进行搜索下载操作. 二:脚本内容 # -*- coding:utf-8 -*- # 百度图片自动爬去 # Chrome浏览器类似,设置其options ...

随机推荐

Jmeter进行接口流程测试
Jmeter进行简单的流程测试此次完成的流程:添加文章-删除文章总的如下: 一.测试计划用户定义的变量中,我定义了3个变量: 二.HTTP cookie管理器填写要添加的cookie 三.JD ...
[转帖]彻底弄懂UTF-8、Unicode、宽字符、locale
彻底弄懂UTF-8.Unicode.宽字符.locale linux后端开发已关注彻底弄懂UTF-.Unicode.宽字符.locale unicode 是字符集 utf-8是编码格式.. ...
Jenkins+maven+gitlab自动化部署之gitLab搭建(二)
Gitlab我们这里采用docker方式部署,详细请参考:Docker部署Gitlab11.10.4
Turn.js 实现翻书效果(自适应单双页)
来源:https://www.cnblogs.com/hellman/p/10683492.html在上面的来源基础上增加页码显示,自适应单双页PC端效果: 移动端展示: 源码下载地址:http:// ...
正则与re模块
一.正则表达式在线测试工具 http://tool.chinaz.com/regex/ 1.字符组在同一个位置可能出现的各种字符组成一个字符组,在正则表达中用[ ]表示一个正则就是一条匹 ...
Python3的内置函数介绍
Python3的官网链接:https://docs.python.org/3/library/functions.html?highlight=built#ascii 内置函数介绍 abs 绝对值函数 ...
十、LCD的framebuffer设备驱动
在读者学习本章以及后续LCD相关章节之前,最好拥有LCD裸机基础,可以参考:LCD编程. 在内核中,表示LCD使用的是framebuffer(帧缓冲,简写为fb),其内容对应于屏幕上的界面显示.修改f ...
十四、i2c子系统
由于之后的触摸屏驱动分析中使用到了GPIO子系统和i2c子系统,因此在分析触摸屏驱动之前我准备把这两个子系统进行简单分析. 在读者学习本章以及后续i2c相关章节之前,最好了解i2c通信方式,可以参考: ...
SAS学习笔记15 SAS导入数据（import txt csv xlsx spss）
hdu 4504 dp问题转化能力不够对状态的转移也是不够
威威猫系列故事——篮球梦 Time Limit: 300/100 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Total ...

使用selenium实现站长素材图片采集

使用selenium实现站长素材图片采集的更多相关文章

随机推荐

热门专题