xpath的chrome插件安装，xpath基本语法

xpath插件安装：

注意：提前安装xpath插件

（1）打开chrome浏览器

（2）点击右上角小圆点

（3）更多工具

（4）扩展程序

（5）拖拽xpath插件到扩展程序中

（6）如果crx文件失效，需要将后缀修改zip

（7）再次拖拽

（8）关闭浏览器重新打开

（9）ctrl + shift + x

（10）出现小黑框

1.安装lxml库

pip install lxml ‐i https://pypi.douban.com/simple

2.导入lxml.etree

from lxml import etree

3.etree.parse() 解析本地文件

html_tree = etree.parse('XX.html')

4.etree.HTML() 服务器响应文件

html_tree = etree.HTML(response.read().decode('utf‐8')

5.html_tree.xpath(xpath路径)

<!--解析.html -->
<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8"/>  <!-- xpath解析严格遵守html规范（标签、单标签要完整）-->

    <title>Title</title>

</head>

<body>

    <ul>

        <li id="l1" class="c1">北京</li>

        <li id="l2">上海</li>

        <li id="c3">深圳</li>

        <li id="c4">武汉</li>

    </ul>

<!--    <ul>-->

<!--        <li>大连</li>-->

<!--        <li>锦州</li>-->

<!--        <li>沈阳</li>-->

<!--    </ul>-->

</body>

</html>

# _*_ coding : utf-8 _*_

# @Time : 2021/11/2 17:50

# @Author : 秋泊酱

from lxml import etree

# xpath解析

# （1）本地文件                                                 etree.parse

# （2）服务器响应的数据  response.read().decode('utf-8') *****   etree.HTML()

# xpath解析本地文件

tree = etree.parse('解析_xpath的基本使用.html')

# tree.xpath('xpath路径')

# 查找ul下面的li

# li_list = tree.xpath('//body/ul/li')

# 查找所有有id的属性的li标签

# text()获取标签中的内容

# li_list = tree.xpath('//ul/li[@id]/text()')

# 找到id为l1的li标签  注意引号的问题

# li_list = tree.xpath('//ul/li[@id="l1"]/text()')

# 查找到id为l1的li标签的class的属性值

# li = tree.xpath('//ul/li[@id="l1"]/@class')

# 查询id中包含l的li标签

# li_list = tree.xpath('//ul/li[contains(@id,"l")]/text()')

# 查询id的值以l开头的li标签

# li_list = tree.xpath('//ul/li[starts-with(@id,"c")]/text()')

# 查询id为l1和class为c1的

# li_list = tree.xpath('//ul/li[@id="l1" and @class="c1"]/text()')

li_list = tree.xpath('//ul/li[@id="l1"]/text() | //ul/li[@id="l2"]/text()')

# 判断列表的长度

print(li_list)

print(len(li_list))

xpath基本语法：

1.路径查询

　　//：查找所有子孙节点，不考虑层级关系

　　/ ：找直接子节点

2.谓词查询

　　//div[@id]

　　//div[@id="maincontent"]

3.属性查询

　　//@class

4.模糊查询

　　//div[contains(@id, "he")]

　　//div[starts‐with(@id, "he")]

5.内容查询

　　//div/h1/text()

6.逻辑运算

　　//div[@id="head" and @class="s_down"]

　　//title | //price

xpath的chrome插件安装，xpath基本语法的更多相关文章

【XPath Helper：chrome爬虫网页解析工具 Chrome插件】XPath Helper：chrome爬虫网页解析工具 Chrome插件下载_教程_安装 - 开发者插件 - Chrome插件网
[XPath Helper:chrome爬虫网页解析工具 Chrome插件]XPath Helper:chrome爬虫网页解析工具 Chrome插件下载_教程_安装 - 开发者插件 - Chrome插 ...
离线Chrome插件安装文件（crx）的安装方法
离线Chrome插件安装文件(crx)的安装方法一.正常安装方法 1.开发谷歌浏览器,设置->扩展程序在打开的谷歌浏览器的扩展管理器中用户可以看到一些已经安装程序的Chrome插件,或者一个 ...
解决chrome插件安装时出现的“程序包无效”问题信息：程序包无效。
https://blog.csdn.net/bluexuemei/article/details/35213117 2014-06-27 09:00:51 bluexuemei 阅读数 14374更多 ...
Chrome 插件安装时报错: "CRX_HEADER_INVALID"
1. 将 crx 插件后缀名改为 rar 2. 解压 rar 包 3. 进入浏览器 1). 点击Chrome浏览器地址栏最右边的三个点 --> 更多工具 --> 扩展插件 --> 点 ...
Chrome插件安装和用法
XPath Helper 下载插件,拖入chrome://extensions/ 使用方法:ctrl+shift+x呼出 JSONView的使用: 安装JSONView插件下载插件,拖入chrome ...
Chrome 插件安装技巧
参考http://blog.csdn.net/shiyaru1314/article/details/49303317 最近在学习WEBAPI 由于没有界面可以调试,需要安装Chrome中的插件 P ...
Chrome插件安装的3种方法，解决拖放不能安装的情况，并提供插件下载
本文摘录于Chrome插件网站方法一:拖放安装下载插件的crx文件后,打开Chrome的扩展页面(chrome://extensions/或按Chrome菜单图标>更多工具>扩展程序) ...
解决Chrome插件安装时程序包无效【CRX_HEADER_INVALID】的错误
将[.crx]后缀的文件拖拽至谷歌浏览器开发者模式下的扩展程序管理页签时,报错[CRX_HEADER_INVALID],即此插件无效的错误. 安装失败的原因原因在于谷歌浏览器在新版本中添加对第三方插 ...
解决Chrome插件安装时出现的“程序包无效”问题
问题原因,新版的插件头部文件的修改,导致旧版的插件包无法使用,解决方式:解压. 1.把下载后的.crx扩展名的离线Chrome插件的文件扩展名改成.zip或者.rar(如果看不到Chrome插件的扩展 ...

随机推荐

Windows环境下搭建Hadoop(2.6.0）+Hive(2.2.0)环境并连接Kettle(6.0)
前提:配置JDK1.8环境,并配置相应的环境变量,JAVA_HOME 一.Hadoop的安装 1.1 下载Hadoop (2.6.0) http://hadoop.apache.org/release ...
SpringCloud升级之路2020.0.x版-26.OpenFeign的组件
本系列代码地址:https://github.com/JoJoTec/spring-cloud-parent 首先,我们给出官方文档中的组件结构图: 官方文档中的组件,是以实现功能为维度的,我们这里是 ...
Spring Boot中使用PostgreSQL数据库
在如今的关系型数据库中,有两个开源产品是你必须知道的.其中一个是MySQL,相信关注我的小伙伴们一定都不陌生,因为之前的Spring Boot关于关系型数据库的所有例子都是对MySQL来介绍的.而今天 ...
使用 PyTorch Lightning 将深度学习管道速度提高 10 倍
前言本文介绍了如何使用 PyTorch Lightning 构建高效且快速的深度学习管道,主要包括有为什么优化深度学习管道很重要.使用 PyTorch Lightning 加快实验周期的六种 ...
Spring框架访问数据库的两种方式的小案例
1.1 以Xml的方式访问数据库的案例要以xml的方式访问数据库需要用到JdbcTemplate ,因为 JdbcTemplate(jdbc的模板对象)在Spring 中提供了一个可以操作数据库的对 ...
Java（2）详解注释&关键字&常量&变量&标识符
作者:季沐测试笔记原文地址:https://www.cnblogs.com/testero/p/15201497.html 博客主页:https://www.cnblogs.com/testero ...
【Spring】重新认识 IoC
前言 IoC (Inversion of control) 并不是Spring特有的概念. IoC 维基百科的解释: In software engineering, inversion of con ...
用例圖學習實例 / Learning Use Case Diagram by Examples
什麼是用例圖? 用例描述了一個演員和感興趣的系統之間的一系列交互,以達到某種特定目標,並由某種觸發事件引發.用例滿足需求或為演員解決問題.用例圖包含一組用例,可以通過從每個角色的不同角度講述系統將如何 ...
[no code][scrum meeting] Alpha 8
项目内容会议时间 2020-04-14 会议主题 API文档第一版交付会议时长 30min 参会人员 PM+OCR组成员 $( "#cnblogs_post_body" ). ...
Golang通脉之并发初探
并发是编程里面一个非常重要的概念,Go语言在语言层面天生支持并发. 并发与并行并发:同一时间段内执行多个任务. 并行:同一时刻执行多个任务,有时间上的重叠. 进程.线程.协程进程(Process) ...

xpath的chrome插件安装，xpath基本语法

xpath的chrome插件安装，xpath基本语法的更多相关文章

随机推荐

热门专题