利用python定位网页上的元素

1. 想对网页上的元素进行操作，首先需要定位到元素。

以百度首页为例：

输入以下代码，打开百度首页：

# coding = gbk

from selenium import webdriver

chrome_driver_path = "C:\Python27\selenium\webdriver\chromedriver\chromedriver"

global browser

browser = webdriver.Chrome(chrome_driver_path)

url_int = "https://www.baidu.com/"

browser.get(url_int)

print "Open baidu"

2. 在打开的百度首页，右键点击，选择“查看网页源代码”。

以下网页源代码是与百度输入框和“百度一下”按钮有关的，先提取在这里，方便后续定位。

<span class="bg s_ipt_wr"><input id="kw" name="wd" class="s_ipt" value="" maxlength="" autocomplete="off"></span><span class="bg s_btn_wr"><input type="submit" id="su" value="百度一下" class="bg s_btn"></span>

3. 定位百度输入框

通过id定位：

browser.find_element_by_id("kw")

通过name定位：

browser.find_element_by_name("wd")

通过标签名tag_name定位：

browser.find_element_by_tag_name("input")

通过class_name定位：

browser.find_element_by_class_name("bg_s_btn_wr")

通过css定位：

以id定位：

browser.find_element_by_css_selector("a[id=\"kw\"]")

以name定位：

browser.find_element_by_css_selector("a[name=\"wd\"]")

通过XPath定位：（XPath是一种在XML文档中定位元素的语言）

attribute属性定位（定位input标签下，id=kw的元素）：

browser.find_element_by_xpath("//input[@id='kw']")

id相关性定位（/form/span/input层级标签下，div标签下，id=fm的元素）：

browser.find_element_by_xpath("//div[@id='fm']/form/span/input")

id为check的tr，定位它的第2个td：

browser.find_element_by_xpath("tr[@id='check']/td[2]")

position位置定位（第7个tr里面的第2个td）：

browser.find_element_by_xpath("//tr[7]/td[2]")

href水平参考定位（a标签下，查找包含‘网页’的文本text元素）：

browser.find_element_by_xpath("//a[contains(text(),'网页')]")

link定位（a标签下，查找链接为'href='http://www.baidu.com/'的元素）：

browser.find_element_by_xpath("//a[@href='http://www.baidu.com']")

通过link定位（可以查找文字链接，打开贴吧链接）：

browser.find_element_by_link_text("贴吧")

browser.find_element_by_partial_link_text("贴")

4. 定位”百度一下“按钮

通过class_name定位：

browser.find_element_by_class_name("bg_s_btn_wr")

利用python定位网页上的元素的更多相关文章

css015 定位网页上的元素
css015 定位网页上的元素一. 定位属性的功能 1. 四中类型的定位 Position: absolute relative fixed static a. 绝对定位绝对定 ...
CSS3-基于浮动的布局，响应式WEB设计，定位网页上的元素，设计打印页面的css技术
基于浮动的布局: 1.除非图片设置了宽度,否则始终应该要对浮动的图片设置一个宽度,这样可以让浏览器给其他内容腾出环绕的空间 2.当侧边栏的高度与主内容区的高度不一致的时候,可以用个margin进行调整 ...
爬虫学习笔记（1）-- 利用Python从网页抓取数据
最近想从一个网站上下载资源,懒得一个个的点击下载了,想写一个爬虫把程序全部下载下来,在这里做一个简单的记录 Python的基础语法在这里就不多做叙述了,黑马程序员上有一个基础的视频教学,可以跟着学习一 ...
有关利用python获取网页，以及KDD近几年论文标题与摘要链接
最近一直在看KDD的论文,不过,由于老师并没有什么合理的方向性,所以考虑把kdd中的大部分内容都利用python将所有标题.摘要获取下来. 还有一个原因在于,看acm上的摘要,都只显示了两行,再看多点 ...
CSS定位网页中的元素
relative相对定位偏移设置:left.right.top.bottom 值单位:px 元素的规律: 相对定位元素的规律设置相对定位的盒子会相对它原来的位置通过指定偏移,到达新的位置. 设置相 ...
Python爬虫个人记录（四）利用Python在豆瓣上写一篇日记
涉及关键词:requests库 requests.post方法 cookies登陆 version 1.5(附录):使用post方法登陆豆瓣,成功! 缺点:无法获得登陆成功后的cookie,要使用js ...
Python从网页上爬取图片
在搜索壁纸的时候,想把壁纸保存到本地,一张一张的保存太过麻烦,所以想到用Python来爬取壁纸. 设计思路: 1.首先先去找有壁纸的网页: http://www.acfun.cn/a/ac334521 ...
利用python监测linux上的服务（简单实现服务宕掉自动发送邮件）
python 这里用到了四个python 模块 : import time (时间模块) import re (正则模块) import socket (监测端口模块)import yagmail ( ...
python下载网页上公开数据集
URL很简单,数据集分散开在一个URL页面上,单个用手下载很慢,这样可以用python辅助下载: 问题:很多国外的数据集,收到网络波动的影响很大,最好可以添加一个如果失败就继续请求的逻辑,这里还没有实 ...

随机推荐

[ PyQt入门教程 ] PyQt5信号与槽
信号和槽是PyQt编程对象之间进行通信的机制.每个继承自QWideget的控件都支持信号与槽机制.信号发射时(发送请求),连接的槽函数就会自动执行(针对请求进行处理).本文主要讲述信号和槽最基本.最经 ...
腾讯位置服务API快速入门
前言之前项目有个需求,在网页上显示微信发送过来的位置信息,该开始想用百度地图,后来发现腾讯地图相对简单一点快速入门申请Key https://lbs.qq.com/guides/startup. ...
memcached.c 源码分析
上文分析了memcached的autoconf过程以及configure, make过程,可以看到,memcached可执行文件是由memcached-memcached.o以及其他文件连接后编译出来 ...
Git命令备忘录
目录前言基本内容开始之前基础内容远程仓库分支管理前言 Git在平时的开发中经常使用,整理Git使用全面的梳理. 基本内容开始之前请自行准备好Git工具以及配置好Git的基本配置基础 ...
【JDK】JDK源码分析-CountDownLatch
概述 CountDownLatch 是并发包中的一个工具类,它的典型应用场景为:一个线程等待几个线程执行,待这几个线程结束后,该线程再继续执行. 简单起见,可以把它理解为一个倒数的计数器:初始值为线程 ...
python_Tensorflow学习（三）：TensorFlow学习基础
一.矩阵的基本操作 import tensorflow as tf # 1.1矩阵操作 sess = tf.InteractiveSession() x = tf.ones([2, 3], &qu ...
aes秘钥限制问题解决办法
在oarcle jdk1.8上执行256位的aes秘钥加密报错如下: java.lang.RuntimeException: java.security.InvalidKeyException: Il ...
android ——活动
活动(Activity)主要用于和用户进行交互,是一种可以包含用户界面的组件. 1.手动创建活动右击com.example.administrator.exp5→New→Activity→Empty ...
python面试总结1(基础章节)
python语言基础语言特点 python是静态还是动态类型?是强类型还是弱类型动态强类型语言动态还是静态指的是编译期还是运作期确定类型强类型指的是不会发生隐式类型转换 python作为后端语 ...
当我们尝试用JavaScipt测网速
npm包地址 https://www.npmjs.com/package/network-speed-test Github地址 https://github.com/penghuwan/networ ...

利用python定位网页上的元素

利用python定位网页上的元素的更多相关文章

随机推荐

热门专题