html = '''
<div>
<ul>
<li class="item-0">li0</li>
<li class="item-1 active">li1</li>
<ul>
<div>
'''
from puquery import PyQuery as pq
doc = pq(html)
#用字符串初始化pyquery
doc = pq(url="https://www.baidu.com")
#用URL初始化pyquery
doc = pq(filename='demo.html')
#用本地文件初始化pyquery

items = doc('.list')
#获取class为list的节点

lis = items.find('li')
#获取其内部的li节点

lis = items.children()
#获取其子节点

lis = items.children('.active')
#获取其class为active的子节点

parent = items.parent()
#获取其父节点

parents = items.parents()
#获取其祖先节点

parent = items.parents('.wrap')
#获取class为wrap的祖先节点

li = doc('.list .item-0.active').siblings('.active')
#选择class为list的节点内部class为item-0和active的节点的class为active兄弟节点

lis = doc('li').items()
for li in lis:
print(li.attr('class'))
print(li.text())
print(li.html())
#获取属性
#获取文本
#获取其内部的html文本
#用items()方法遍历

li = doc('.item-0 active')
li.removeClass('active')
li.addClass('active')
#动态改变节点的class属性

li.attr('name','link')
#修改属性
li.text('niconiconi')
#修改文本
li.html('<span>niconiconi</span>')
#修改html文本

doc.find('li').remove()
#删除li节点

li = doc('li:first-child')
li = doc('li:last-child')
li = doc('li:nth-child(2)')
li = doc('li:gt(2)')
li = doc('li:nth-child(2n)')
li = doc('li:contains(second)')
#伪类选择器

pyquery库简介的更多相关文章

  1. Python3.x:第三方库简介

    Python3.x:第三方库简介 环境管理 管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具. pyenv – 简单的 Python 版本管理工具. Vex ...

  2. 学习PyQuery库

    学习PyQuery库 好了,又是学习的时光啦,今天学习pyquery 来进行网页解析 常规导入模块(PyQuery库中的pyquery类) from pyquery import PyQuery as ...

  3. BerkeleyDB库简介

    BerkeleyDB库简介 BerkeleyDB(简称为BDB)是一种以key-value为结构的嵌入式数据库引擎: 嵌入式:bdb提供了一系列应用程序接口(API),调用这些接口很简单,应用程序和b ...

  4. LevelDB库简介

    LevelDB库简介 一.LevelDB入门 LevelDB是Google开源的持久化KV单机数据库,具有很高的随机写,顺序读/写性能,但是随机读的性能很一般,也就是说,LevelDB很适合应用在查询 ...

  5. python爬虫从入门到放弃(七)之 PyQuery库的使用

    PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严 ...

  6. MXNet深度学习库简介

    MXNet深度学习库简介 摘要: MXNet是一个深度学习库, 支持C++, Python, R, Scala, Julia, Matlab以及JavaScript等语言; 支持命令和符号编程; 可以 ...

  7. 爬虫常用库之pyquery 库

    pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,我个人写过的一些抓取网页数据的脚本就是用它来解析html获取数据的.他的官方文档地址是:http://packages. ...

  8. Python中PyQuery库的使用总结

    介绍 pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,官方文档地址是:http://packages.python.org/pyquery/ pyquery 可让你用 ...

  9. Python爬虫-- PyQuery库

    PyQuery库 PyQuery库也是一个非常强大又灵活的网页解析库,PyQuery 是 Python 仿照 jQuery 的严格实现.语法与 jQuery 几乎完全相同,所以不用再去费心去记一些奇怪 ...

随机推荐

  1. oracle 触发器序列号自增

    步骤:1.创建表 table 2.创建序列 SEQUENCE 3.创建 触发器 截图实例:

  2. 高德地图之c#后台获取一个或多个起点到单个终点的直线距离

    首先我们需要一个控制台添加一个新Key(可使用服务选择Web服务,测试的时候IP白名单先不填); 直线距离是通过后台get方式请求API服务地址http://restapi.amap.com/v3/d ...

  3. 在IIS上部署Asp.Net Core 2.2.0

    1. .NET Core与Windows环境 Asp.Net Core 2.2.0 Windows 10 2. 先决条件   下载并安装.Net Core Hosting Bundle. 3. 部署过 ...

  4. Android理解:Activity状态和生命周期

    http://blog.csdn.net/xiao__gui/article/details/11464603

  5. python3入门之类

    在面向对象的语言中,类是最重要的一环,python自然拥有类这个机制.python的类机制,与C++,java的区别不是很大,类的大多数的重要特性都被沿用了,一样可以多态,抽象,封装: python3 ...

  6. 编译图像质量分析库iqa

    介绍   iqa库是我在GitHub上偶然发现的一个具有MSE, PSNR, SSIM, MS-SSIM等图像质量分析算法的库,觉得还不错,就把它下载下来编译,编译后生成静态的库.以下是我总结的编译方 ...

  7. Python+selenium 模拟wap端页面操作

    from selenium.webdriver.chrome.options import OptionsmobileEmulation = {'deviceName': 'iPhone X'}opt ...

  8. document.documentElement和document.body区别介绍

    document.documentElement和document.body区别介绍 * 区别 body是DOM对象黎明的body子节点,即标签 docummentElement 是整个树的根节点ro ...

  9. python全栈开发_day5_字符串及列表类型

    一:字符串 1)优先掌握知识点. a=" 21j3:b12jk:b3j12:3bjk12 " #内置方法之strip print(a.strip(" ")) # ...

  10. SPOJ - COT 路径构造主席树

    题意:给出一个带权树,多次询问路径\((u,v)\)的第k小权值 这是主席树往区间扩展到树上的套路题 由于是按路径查询,我们无法使用dfs序,但可利用主席树对父亲扩展的方法构造出链 因此要用dfs构造 ...