# 标题
list_title = driver.find_elements_by_xpath('//*[@id="share-content"]/div/div[1]/ul/li/h3/a')
print(list_title)
# 用selenium + xpath 抓取网页数据,上述代码返回的是列表类型,打印出来是:
[<selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-1")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-2")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-3")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-4")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-5")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-6")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-7")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-8")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-9")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-10")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-11")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-12")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-13")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-14")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-15")>]
for i in list_title:
print(type(i)) 显示结果:<class 'selenium.webdriver.remote.webelement.WebElement'> 抓取到的信息不能以中文形式显示出来,一时间陷入了怎么去编码解码解决这类型的代码,在网上找了好多方法去试,结果都报错,翻看笔记,原来这个方法很简单!!
for i in list_title:
print(i.text)
把列表遍历,.text方法即可得到想要的文本内容。与xpath中的text()又不一样。 1.从定位到的元素中获取数据
    el.get_attribute(key)            获取key属性名对应的属性值
    el.text                        获取开闭标签之间的文本内容
       
    1.对定位到的元素的操作
    el.click()                        对元素执行点击操作

    el.submit()                      对元素执行提交操作

    el.clear()                        清空可输入元素中的数据

    el.send_keys(data)               向可输入元素输入数据
 

selenium获取文本的更多相关文章

  1. Selenium 获取文本信息方法+select(定位)

    1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等 driver.find_element_by_xpath("//div[/h1").text 2.直接 ...

  2. Python+selenium之获取文本值和下拉框选择数据

    Python+selenium之获取文本值和下拉框选择数据 一.结合实例进行描述 1. 实例如下所示: #新增标签操作 def func_labels(self): self.driver.find_ ...

  3. selenium 获取不了标签文本的解决方法

    selenium 获取不了标签文本的解决方法 ------ 即driver.find_element_by_xxx().text() 为空的解决办法 如果得到的文本只为空,而非我们期望的baidu,那 ...

  4. 使用python处理selenium中的获取文本问题

    # 获取文本 button_name = self.driver.find_element_by_id("sign_in_display").text

  5. 自动化测试基础篇--Selenium获取元素属性

    摘自https://www.cnblogs.com/sanzangTst/p/8375938.html 通常在做断言之前,都要先获取界面上元素的属性,然后与期望结果对比. 一.获取页面title 二. ...

  6. Python3.x:selenium获取iframe内嵌页面的源码

    Python3.x:selenium获取iframe内嵌页面的源码 前言 在一些网页中经常会看到ifrmae/frame标签,iframe是嵌入式框架一般用来在已有的页面中嵌入另一个页面,当一个元素在 ...

  7. 【NLP】Python NLTK获取文本语料和词汇资源

    Python NLTK 获取文本语料和词汇资源 作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集 ...

  8. js/jquery获取文本框的值与改变文本框的值

    我们就用它来学习获取文本框的值及改变文本框的值. 代码如下 复制代码 <script>function get1(){ document.getElementById("txtb ...

  9. selenium获取多窗口句柄并一一切换至原窗口句柄(三个窗口)

    网上有很多是selenium基于python来获取两个窗口句柄与切换,本文实现用python+selenium获取多窗口句柄并一一切换至原窗口句柄(三个窗口),且在每个窗口下进行一个搜索或翻译,然后截 ...

随机推荐

  1. CORS跨域-Nginx使用方法(Access-Control-Allow-Origin错误提示)

    问题说明 当出现上图这个的时候,是访问请求外域URL无法访问,浏览器认为访问外域URL不安全,导致访问不了简称跨域问题.而这上面出现一句很重要的话“NO Access-Control-Allow-Or ...

  2. Mean reversion (finance) 均值回归

    Mean reversion (finance)  均值回归

  3. [skill][git] git 常用操作记录

    傻瓜入门: step by step : https://try.github.io/levels/1/challenges/1 一本书: https://git-scm.com/book/en/v2 ...

  4. 转:ActiveMQ的作用总结(应用场景及优势)

    原文地址: ActiveMQ的作用总结(应用场景及优势) 业务场景说明: 消息队列在大型电子商务类网站,如京东.淘宝.去哪儿等网站有着深入的应用, 队列的主要作用是消除高并发访问高峰,加快网站的响应速 ...

  5. pandas基础

    1.相关库导入 2.创建数据结构 pandas 有两个重要的数据结构: Series 和 DataFrame 创建Series数组,代表一行或一列 创建DataFrame ,代表二维数组 第一种方式: ...

  6. 【三分】light bulb(zoj3203)

    题目描述: 如图,你可以在房间里移动,灯泡的高度为H,你的身高为h,灯泡与墙的水平距离为D,求你影子的最长长度(影子长度=地上影子长度+墙上影子长度) 样例输入: 0.5 样例输出: 1.000 0. ...

  7. java执行字符串数学表达式【记录】

    https://stackoverflow.com/questions/3422673/evaluating-a-math-expression-given-in-string-form 1. goo ...

  8. java安全删除一个文件,防止工具恢复数据

    解决移动端文件删除的安全问题:file.delect()   Java 确保安全删除某个文件 http://outofmemory.cn/code-snippet/14222/Java-securit ...

  9. awk命令的基本使用

    命令主要用法 -格式1:前置命令 | awk [选项] '[条件]{编辑指令}' -格式2:awk [选项] '[条件]{编辑指令}' filename 常用命令选项 -F:指定分隔符,可省略(默认空 ...

  10. 虚拟机开启时 VMware Authorization Service 这个服务找不到的解决办法

    有些时候我们启动虚拟机 会出现 The VMware Authorization Service is not running 正常情况下我们只要进 我的电脑-------> 管理------- ...