selenium获取文本
# 标题
list_title = driver.find_elements_by_xpath('//*[@id="share-content"]/div/div[1]/ul/li/h3/a')
print(list_title)
# 用selenium + xpath 抓取网页数据,上述代码返回的是列表类型,打印出来是:
[<selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-1")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-2")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-3")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-4")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-5")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-6")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-7")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-8")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-9")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-10")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-11")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-12")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-13")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-14")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-15")>]
for i in list_title:
print(type(i)) 显示结果:<class 'selenium.webdriver.remote.webelement.WebElement'> 抓取到的信息不能以中文形式显示出来,一时间陷入了怎么去编码解码解决这类型的代码,在网上找了好多方法去试,结果都报错,翻看笔记,原来这个方法很简单!!
for i in list_title:
print(i.text)
把列表遍历,.text方法即可得到想要的文本内容。与xpath中的text()又不一样。 1.从定位到的元素中获取数据
el.text 获取开闭标签之间的文本内容
1.对定位到的元素的操作
el.click() 对元素执行点击操作
selenium获取文本的更多相关文章
- Selenium 获取文本信息方法+select(定位)
1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等 driver.find_element_by_xpath("//div[/h1").text 2.直接 ...
- Python+selenium之获取文本值和下拉框选择数据
Python+selenium之获取文本值和下拉框选择数据 一.结合实例进行描述 1. 实例如下所示: #新增标签操作 def func_labels(self): self.driver.find_ ...
- selenium 获取不了标签文本的解决方法
selenium 获取不了标签文本的解决方法 ------ 即driver.find_element_by_xxx().text() 为空的解决办法 如果得到的文本只为空,而非我们期望的baidu,那 ...
- 使用python处理selenium中的获取文本问题
# 获取文本 button_name = self.driver.find_element_by_id("sign_in_display").text
- 自动化测试基础篇--Selenium获取元素属性
摘自https://www.cnblogs.com/sanzangTst/p/8375938.html 通常在做断言之前,都要先获取界面上元素的属性,然后与期望结果对比. 一.获取页面title 二. ...
- Python3.x:selenium获取iframe内嵌页面的源码
Python3.x:selenium获取iframe内嵌页面的源码 前言 在一些网页中经常会看到ifrmae/frame标签,iframe是嵌入式框架一般用来在已有的页面中嵌入另一个页面,当一个元素在 ...
- 【NLP】Python NLTK获取文本语料和词汇资源
Python NLTK 获取文本语料和词汇资源 作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集 ...
- js/jquery获取文本框的值与改变文本框的值
我们就用它来学习获取文本框的值及改变文本框的值. 代码如下 复制代码 <script>function get1(){ document.getElementById("txtb ...
- selenium获取多窗口句柄并一一切换至原窗口句柄(三个窗口)
网上有很多是selenium基于python来获取两个窗口句柄与切换,本文实现用python+selenium获取多窗口句柄并一一切换至原窗口句柄(三个窗口),且在每个窗口下进行一个搜索或翻译,然后截 ...
随机推荐
- Exception 04 : java.lang.ClassNotFoundException: Could not load requested class : org.hsqldb.jdbcDriver
异常详细信息 org.hibernate.boot.registry.classloading.spi.ClassLoadingException: Unable to load class [org ...
- 对内存分配的理解 自动变量 局部变量 临时变量 外部变量 字符串长度 C语言可以看成由一些列的外部对象构成
Status ListInsert_Sq(SqList *L,int i,LElemType_Sq e) { LElemType_Sq *newbase; LElemType_Sq *p,*q; if ...
- day 0314函数的进阶
1.空间:内置空间,全局空间,局部空间. 内置空间:空间存放python解释器,为我们提供了方便的名字:input,print,str,list,tuple 三个空间的加载顺序: 内置空间>&g ...
- Xcode报错Expected selector for Objective-C and Expected method body
昨天把键盘拿起来拍一下清清灰,然后就发现Xcode报错了,Xcode报错Expected selector for Objective-C and Expected method body,也不知道什 ...
- 【PyQt5-Qt Designer】QSpinBox-微调框
QSpinBox-微调框 QSpinBox类提供了一个微调框小部件. QSpinBox被设计为处理整数和离散值集合(例如,月份名称):使用QDoubleSpinBox 可以作为浮点数的调整. QSpi ...
- 浅谈Trie树
Trie树,也叫字典树.顾名思义,它就是一个字典 字典是干什么的?查找单词!(英文字典哦) 个人认为字典树这个名字起得特别好,因为它真的跟字典特别像,一会r你就知道了. 注:trie的中文翻译就是单词 ...
- List去重问题
如果集合中的数据类型是基本数据类型,可以直接将list集合转换成set,就会自动去除重复的元素,这个就相对比较简单. public class Test { public static void ma ...
- redis缓存和mysql数据库同步
附redis关于缓存雪崩和缓存穿透,热点key 穿透 穿透:频繁查询一个不存在的数据,由于缓存不命中,每次都要查询持久层.从而失去缓存的意义. 解决办法: 持久层查询不到就缓存空结果,查询时先判断缓存 ...
- python3 open()函数调用方法简单示例
python3 open()函数调用简介.Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError. 注 ...
- linux命令学习:PATH and LDFLAGS and CFLAGS
CFLAGS 表示用于 C 编译器的选项, CXXFLAGS 表示用于 C++ 编译器的选项. 这两个变量实际上涵盖了编译和汇编两个步骤. 先来看几个相关的环境变量:PATH.LDFLAGS. ...