pyquery库简介

html = '''
<div>
<ul>
<li class="item-0">li0</li>
<li class="item-1 active">li1</li>
<ul>
<div>
'''
from puquery import PyQuery as pq
doc = pq(html)
#用字符串初始化pyquery
doc = pq(url="https://www.baidu.com")
#用URL初始化pyquery
doc = pq(filename='demo.html')
#用本地文件初始化pyquery

items = doc('.list')
#获取class为list的节点

lis = items.find('li')
#获取其内部的li节点

lis = items.children()
#获取其子节点

lis = items.children('.active')
#获取其class为active的子节点

parent = items.parent()
#获取其父节点

parents = items.parents()
#获取其祖先节点

parent = items.parents('.wrap')
#获取class为wrap的祖先节点

li = doc('.list .item-0.active').siblings('.active')
#选择class为list的节点内部class为item-0和active的节点的class为active兄弟节点

lis = doc('li').items()
for li in lis:
print(li.attr('class'))
print(li.text())
print(li.html())
#获取属性
#获取文本
#获取其内部的html文本
#用items()方法遍历

li = doc('.item-0 active')
li.removeClass('active')
li.addClass('active')
#动态改变节点的class属性

li.attr('name','link')
#修改属性
li.text('niconiconi')
#修改文本
li.html('<span>niconiconi</span>')
#修改html文本

doc.find('li').remove()
#删除li节点

li = doc('li:first-child')
li = doc('li:last-child')
li = doc('li:nth-child(2)')
li = doc('li:gt(2)')
li = doc('li:nth-child(2n)')
li = doc('li:contains(second)')
#伪类选择器

pyquery库简介的更多相关文章

Python3.x：第三方库简介
Python3.x:第三方库简介环境管理管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具. pyenv – 简单的 Python 版本管理工具. Vex ...
学习PyQuery库
学习PyQuery库好了,又是学习的时光啦,今天学习pyquery 来进行网页解析常规导入模块(PyQuery库中的pyquery类) from pyquery import PyQuery as ...
BerkeleyDB库简介
BerkeleyDB库简介 BerkeleyDB(简称为BDB)是一种以key-value为结构的嵌入式数据库引擎: 嵌入式:bdb提供了一系列应用程序接口(API),调用这些接口很简单,应用程序和b ...
LevelDB库简介
LevelDB库简介一.LevelDB入门 LevelDB是Google开源的持久化KV单机数据库,具有很高的随机写,顺序读/写性能,但是随机读的性能很一般,也就是说,LevelDB很适合应用在查询 ...
python爬虫从入门到放弃（七）之 PyQuery库的使用
PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严 ...
MXNet深度学习库简介
MXNet深度学习库简介摘要: MXNet是一个深度学习库, 支持C++, Python, R, Scala, Julia, Matlab以及JavaScript等语言; 支持命令和符号编程; 可以 ...
爬虫常用库之pyquery 库
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,我个人写过的一些抓取网页数据的脚本就是用它来解析html获取数据的.他的官方文档地址是:http://packages. ...
Python中PyQuery库的使用总结
介绍 pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,官方文档地址是:http://packages.python.org/pyquery/ pyquery 可让你用 ...
Python爬虫-- PyQuery库
PyQuery库 PyQuery库也是一个非常强大又灵活的网页解析库,PyQuery 是 Python 仿照 jQuery 的严格实现.语法与 jQuery 几乎完全相同,所以不用再去费心去记一些奇怪 ...

随机推荐

wpf Route Event Code Snippet
将下面内容保存为snippet后缀文件,通过vs的代码片段管理工具导入即可,快捷键请按需修改: <?xml version="1.0" encoding="utf- ...
HttpWebRequest(System.Net)模拟HTTP发送POST
相关参考网上很多,但需要理解并转成自己的情况 public static string HttpWebRequestPost(string url, string param) { HttpWebRe ...
.net core i上 K8S(四).netcore程序的pod管理，重启策略与健康检查
上一章我们已经通过yaml文件将.netcore程序跑起来了,但还有一下细节问题可以分享给大家. 1.pod管理 1.1创建pod kubectl create -f netcore-pod.yaml ...
documeant 学习总结（二）
(一)移除节点及属性 /**移除节点和属性的操作 * @throws DocumentException */ public void RemoveOperator() ...
小程序：如何在wxml页面中调用JavaScript函数
早上过来遇到一个这样的bug: 在计算百分比的时候没有保留小数点后2位,从而导致一些无法整除的结果显示太长一开始,我以为这是一个很普通的bug,既然wxml在页面{{}}内支持简单的运算,我想也应该 ...
题解 UVA11300 【Spreading the Wealth】
环形均分纸牌问题应该不少人都很熟悉了,而且题解区写的也比较全了...... 我这篇题解主要是介绍一个新的STL--nth_element 以及解答几个其他题解里面有应用但是没有注释的问题.(比如说我第 ...
kali linux之msf信息收集
nmap扫描 Auxiliary 扫描模块目前有557个扫描方式
sql case 函数与详细说明
下面是一个是用case函数来完成这个功能的例子 case具有两种格式.简单case函数和case搜索函数. --简单case函数 case sex when '1' then '男' ...
docker部署sftp
一. 按照我博客中搭建sftp的方法做一个docker镜像这种方法可用,但不是最好的,待改进.可参照另一篇博客:设置多用户不同权限的sftp服务器搭建 1. dockerfile文件如下,当前目录假 ...
spring里面的ioc的理解？
spring里面的ioc就是控制反转,其实现核心是DI(依赖注入),控制反转不向以前java代码里面,通过new关键字来实现创建对象,这样每段代码之间的耦合度就比较高,为了降低每个小模块之间的耦合度, ...

pyquery库简介

pyquery库简介的更多相关文章

随机推荐

热门专题