简介: 以前都用PhantomJS来进行无界面模式的自动化测试,或者爬取某些动态页面. 但是最近selenium更新以后,'Selenium support for PhantomJS has been deprecated, please use headless '提示不支持PhantomJs,请使用headless模式. 好吧,我们还是继续使用firefox chrome的headless模式吧. 一:版本确认 1.windows下 selenium  3.9.0 我使用这个版本的sele…
环境准备 前言 selenium在windows机器上运行,每次会启动界面,运行很不稳定.于是想到用chrome来了的headless无界面模式,确实方便了不少. 为了提高自动化运行的效率和稳定性,于是把selenium自动化环境部署到linux服务器上,这样更方便. 环境: centons 7.6 python 3.6 chrome 77.0.3865.90 chromedriver 77.0.3865.40 selenium 3.14 安装最新版chrome 方法一:下载到本地后安装 先下载…
from selenium.webdriver.chrome.options import Options from selenium import webdriver # 无界面模式 def ChromeDriverNOBrowser(): chrome_options = Options() chrome_options.add_argument('--headless') chrome_options.add_argument('--disable-gpu') driverChrome =…
环境:docker centos 7.4 能通外网 写好的selenium脚本. 具体步骤: 一:安装selenium  这是最简单的 直接利用 pip3 install selenium 二 安装chrome yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm 三 安装chrome-driver 首先查看自己的chrome版本,因为是安装的稳定版  yum list | g…
以Chrome浏览器为例: 方法一: from selenium.webdriver import Chrome, ChromeOptions opt = ChromeOptions() # 创建Chrome参数对象 opt.headless = True # 把Chrome设置成可视化无界面模式,windows/Linux 皆可 driver = Chrome(options=opt) # 创建Chrome无界面对象 driver.get('http://www.baidu.com')prin…
一.使用无界面模式 1.正常情况启动 selenium 是有界面的 2.有些情况下,需要不显示界面,这时只要设置一下参数就可以实现了 # 不想显示界面可以用 Chrome——配置一下参数就好 from selenium import webdriver from selenium.webdriver.chrome.options import Options def main(): chrome_options = Options() chrome_options.add_argument('-…
一般的的静态HTML页面可以使用requests等库直接抓取,但还有一部分比较复杂的动态页面,这些页面的DOM是动态生成的,有些还需要用户与其点击互动,这些页面只能使用真实的浏览器引擎动态解析,Selenium和Chrome Headless可以很好的达到这种目的. Headless Chrome Headless Chrome 是 Chrome 浏览器的无界面形态,可以在不打开浏览器的前提下,使用所有Chrome支持的特性,在命令行中运行你的脚本.以前在爬虫要使用Phantomjs来实现这些功…
简介 曾经被广大网民吐槽的Windows Vista现在已经淡出了人们的视线,但仍有一些朋友想要体验一下这个操作系统.Windows Vista是Windows发展路线上的里程碑,相比之前的Windows XP,无论是从功能上还是从外观上都有很大的改变,当然还包括比较‘严苛’的配置要求.这让Windows Vista在发布之初就出现各种问题.经过微软的努力修补,如今我们可以看到的Windows Vista已经算是很完善的了.但由于支持期的结束,新安装Windows Vista的用户碰到了新的问题…
Selenium启动浏览器时,默认是打开一个新用户,不会加载原有的配置以及插件.但有些时候我们可能需要加载默认配置. 一.Chrome浏览器 1.在Chrome浏览器的地址栏输入:chrome://version/,查看个人资料路径并复制路径 2.加载配置数据 加载的用户配置路径后面的Default不需要,不然还是打开一个新用户. 在执行脚本时,确保没有谷歌浏览器打开,不然会报selenium.common.exceptions.WebDriverException: Message: unkn…
Selenium启动浏览器时,默认是打开一个新用户,不会加载原有的配置以及插件.但有些时候我们可能需要加载默认配置. 一.Chrome浏览器 1.在Chrome浏览器的地址栏输入:chrome://version/,查看个人资料路径并复制路径 2.加载配置数据 加载的用户配置路径后面的Default不需要,不然还是打开一个新用户. 在执行脚本时,确保没有谷歌浏览器打开,不然会报selenium.common.exceptions.WebDriverException: Message: unkn…
原文地址:https://www.cnblogs.com/eastonliu/p/9083982.html Selenium启动浏览器时,默认是打开一个新用户,不会加载原有的配置以及插件.但有些时候我们可能需要加载默认配置. 一.Chrome浏览器 1.在Chrome浏览器的地址栏输入:chrome://version/,查看个人资料路径并复制路径 2.加载配置数据 加载的用户配置路径后面的Default不需要,不然还是打开一个新用户. 在执行脚本时,确保没有谷歌浏览器打开,不然会报seleni…
引入Options: 配置浏览器: 配置浏览器options,然后传入webdriver.Chrome()就可以成功使用了.…
使用chrome进行远程调试命令: chrome://inspect 编辑hosts文件,添加: Hosts文件路径:C:\Windows\System32\drivers\etc\hosts 61.91.161.217 chrome-devtools-frontend.appspot.com61.91.161.217 chrometophone.appspot.com 即可…
一.Selenium Selenium是一个用于Web应用程序测试的工具,它可以在各种浏览器中运行,包括Chrome,Safari,Firefox 等主流界面式浏览器. 我们可以直接用pip install selenium来进行安装. 中文翻译文档:https://selenium-python-zh.readthedocs.io/en/latest/index.html 官方文档:https://selenium-python.readthedocs.io/ 二.Headless Chrom…
本来想直接用Ubuntu系统里面的firefox来实现selenium自动操作签到的,但是总是出各种问题.没办法,改为Chrome.参考:Ubuntu 线上无界面服务器 使用selenium chrome + headless 但是过程还是遇到一些问题,主要有: 1.chrome驱动上传问题,按教程说的传到/usr/bin,可是却传不上去,换了几个SSH工具都一样,后来发现是权限问题,可以用 chmod 777 XXX 修改权限. 2.运行py文件时又是权限问题,继续用chmod修改驱动权限.…
Web自动化 这里所说的Web自动化是所有跟页面相关的自动化,比如页面爬取,数据抓取,页面内容检测,页面功能测试,页面加载性能测试,页面回归测试等等,当前主要由如下几种解决方式: 文本数据获取 这就是各种request库或者类似curl这样的工具做的事情,拿到的是页面的文本,然后进行XML文档解析,获得相应的内容.但如果页面有一些动态执行的内容,比如JavaScript生成跳转URL,这样就搞不定了,需要有JS引擎的工具来搞,比如再配合JS引擎自行实现的工具,或者直接使用浏览器内核来搞的工具.…
使用Selenium操作headless chrome 推荐 简介 WebDriver是一个W3C标准, 定义了一套检查和控制用户代理(比如浏览器)的远程控制接口,各大主流浏览器来实现这些接口以便调用控制接口来操作浏览器. Selenium是一整套的Web自动化测试解决方案,配合WebDrive规范,实现了对各种用户代理的适配(比如浏览器,PhantomJS等),通过操作浏览器的WebDriver接口来实现带浏览器的Web自动化. 使用selenium-webdriver selenium相关的…
最近整理一下手头上搞过的一些爬虫,有HttpClients+jsoup,Jsoup,htmlunit,HeadlessChrome 一,HttpClients+jsoup,这是第一代比较low,很快就被第二代代替了! 二,Jsoup 需要的jar包: <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.10.3</…
原文地址:Getting Started with Headless Chrome  By EricBidelman  Engineer @ Google working on web tooling: Headless Chrome, Puppeteer, Lighthouse Headless Chrome在Chrome59中发布,用于在headless环境中运行Chrome浏览器,也就是在非Chrome环境中运行Chrome.它将Chromium和Blink渲染引擎提供的所有现代Web平台…
命令行运行Headless Chrome Chrome 安装(需要带梯子) 下载地址 几个版本的比较 Chromium 不是Chrome,但Chrome的内容基本来源于Chromium,这个是开源的版本,小时级别的更新 Canary 是试验版,翻译过来就是金丝雀,金丝雀对瓦斯等毒气很敏感,浓度稍高就会停止鸣叫甚至挂掉,金丝雀是瓦斯等毒气检测的土办法,这个场景在<寻龙诀>中黄渤的操作中也能看到.哈哈 扯远了,这个是daily build 版本. Dev 是开发版,weekly build版本 B…
简评:TLS 1.0 发布至今已将近 20 周年即将寿终正寝,期间为我们保障了千亿次甚至万亿次的数据请求安全. TLS 工作组几个月前发布声明文件弃用 TLS 1.0 和 TLS 1.1. 昨天,包括火狐,Safari,Chorme,Edge 在内的几个浏览器大厂同时发表声明将于 2020 年全面停止支持 TLS 1.0 和 1.1,对于停止支持后还在使用的网页将会向用户弹窗网页安全提示. TLS 是一种网络数据安全的加密协议,防止数据被攻击和窃听 使用这个协议最广的便是 HTTPS ,它是 H…
环境:Python 3.5.x + Selenium 3.4.3 + Chromedriver 2.30 + Chrome 60 beta版 + WIN7/WIN10 chrome_options = webdriver.ChromeOptions() chrome_options.add_argument('--headless') driver = webdriver.Chrome(chrome_options=chrome_options) 代码很简单,只是环境要强调说明一下,Chrome…
Method1: from selenium import webdriver # 创建chrome参数对象opt = webdriver.ChromeOptions() # 把chrome设置成无界面模式,不论windows还是linux都可以,自动适配对应参数opt.set_headless() # 创建chrome无界面对象driver = webdriver.Chrome(options=opt) # 访问百度driver.get('https://baidu.com/') #打印内容p…
今天发现最新版本的selenium3.11.0停止对PhantomJS的支持,需要对selenium降级 卸载最新版本:pip3 uninstall selenium 安装历史版本:pip3 install selenium==3.10.0 通过尝试,3.8.0版本不会再提示. 另外,在系统环境变量中添加phantomjs的存放目录,仍然提示有问题.经过搜索,csdn网友提供的答案,如下代码,需要添加路径作为参数. driver = webdriver.PhantomJS(executable_…
在使用PhantomJS时候,出现提示: UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead 意思是说:新版本的Selenium不再支持PhantomJS了,请使用Chrome或Firefox的无头版本来替代. 问完谷歌,发现原来是PhantomJS开发者内部矛盾,并且Firefox和Chrome都带了无…
1.参考 使用 headless chrome进行测试 2.概念 Headless模式解决了什么问题: 自动化工具例如 selenium 利用有头浏览器进行测试,面临效率和稳定性的影响,所以出现了 Headless Browser, 3年前,无头浏览器 PhantomJS 已经如火如荼出现了,紧跟着 NightmareJS 也成为一名巨星.无头浏览器带来巨大便利性:页面爬虫.自动化测试.WebAutomation... 用过PhantomJS的都知道,它的环境是运行在一个封闭的沙盒里面,在环境内…
pip install selenium 因为phantomJS将停止维护,所以建议使用headless chromeChromeDriver is a separate executable that WebDriver uses to control Chrome. 1.确保谷歌浏览器安装在可以找到的位置(默认位置或自己指定的位置).如果不是默认位置,则需要用下面的代码来指定谷歌浏览器的安装位置:ChromeOptions options = new ChromeOptions();opti…
selenium是一个Web的自动化测试工具,它可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生.但是它自身不带浏览器,不支持浏览器的功能,因此它需要与第三方浏览器结合在一起才能使用.当selenium升级到3.0之后,对不同的浏览器驱动进行了规范.如果想使用selenium驱动不同的浏览器,必须单独下载并设置不同的浏览器驱动.本文以Chrome浏览器为例,需要安装驱动chromedriver 一.安装selenium sudo pip3 i…
<!DOCTYPE html> <html> <head> <meta charset=" utf-8"> <meta name="author" content="http://www.jb51.net/" /> <title>拒绝IE8-,CSS3 transform rotate旋转动画效果(支持IE9+/chrome/firefox)</title> &l…
selenium设置chrome和phantomjs的请求头信息   出于反爬虫也好-跳转到手机端页面也好都需要设置请求头,那么如何进行呢? 目录 一:selenium设置phantomjs请求头: 二:selenium设置chrome请求头: 三:selenium设置chrome–cookie: 四:selenium设置phantomjs-图片不加载: 一:selenium设置phantomjs请求头: 可以复制下列代码运行,会访问https://httpbin.org/get?show_en…