[Python]BeautifulSoup标签的遍历

1.下行遍历

标签树的下行遍历
.content 子节点列表，将tag所有儿子节点存入列表
.children 子节点的迭代类型，与.contents类似用于循环遍历儿子节点
.descendants 子孙节点的迭代类型，包含所有子孙节点，用于循环遍历

测试代码：

import requests

from bs4 import BeautifulSoup

r=requests.get("http://python123.io/ws/demo.html")

demo=r.text

soup=BeautifulSoup(demo,"html.parser")

print(soup.head) #head标签内容

print(soup.head.contents) #head标签子节点的内容

print(soup.body.contents) #body标签子节点的内容

print(len(soup.body.contents)) #body标签的子节点层数

print(soup.body.contents[1]) #

2.上行遍历

.parent 节点的父亲标签

.parents 循环遍历先辈节点

测试代码：

import requests

from bs4 import BeautifulSoup

r=requests.get("http://python123.io/ws/demo.html")

demo=r.text

soup=BeautifulSoup(demo,"html.parser")

#print(soup.title.parent)

#print(soup.html.parent)

for parent in soup.a.parents:

    if parent is None:

        print(parent)

    else:

        print(parent.name)

3.平行遍历

标签树的平行遍历
.next_sibling 返回按照HTML文本顺序的下一个平行节点标签
.previous_sibling 返回按照HTML文本顺序的上一个平行节点标签
.nex_siblings 迭代类型，返回按照HTML文本顺序的后续所有平行节点标签
.previous_siblings 迭代类型，返回按照HTML文本顺序的前续所有平行节点标签

测试代码：

import requests

from bs4 import BeautifulSoup

r=requests.get("http://python123.io/ws/demo.html")

demo=r.text

soup=BeautifulSoup(demo,"html.parser")

print(soup.a.next_sibling) #a的平行标签

print(soup.a.next_sibling.next_sibling) #a标签的下一个标签的平行标签

print(soup.a.previous_sibling) #a标签的上一个标签

print(soup.a.previous_sibling.previous_sibling) #a标签的上一个标签的平行标签

[Python]BeautifulSoup标签的遍历的更多相关文章

python BeautifulSoup库的基本使用
Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree). 它提供简单又常用的导航(navigating),搜索以 ...
Struts 2的iterator标签来遍历一个含有双层List的嵌套
今天碰到一个很有意思的问题,就是需要用Struts 2的iterator标签来遍历一个含有双层List的嵌套. 首先我们从最基础的说起,用iterator标签遍历一个List. 如果Action中有一 ...
【转】Python BeautifulSoup 中文乱码解决方法
这篇文章主要介绍了Python BeautifulSoup中文乱码问题的2种解决方法,需要的朋友可以参考下解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输 ...
Python os.walk文件遍历用法【转】
python中os.walk是一个简单易用的文件.目录遍历器,可以帮助我们高效的处理文件.目录方面的事情. 1.载入要使用os.walk,首先要载入该函数可以使用以下两种方法 import os ...
python实现dict版图遍历
python实现dict版图遍历的示例. 代码: #_*_coding:utf_8_import sysimport osclass Graph(): def __init__(self, V, E) ...
Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）
xml实例: 版本一: <?xml version="1.0" encoding="UTF-8"?><country name="c ...
Python beautifulsoup 选择器 select 选择<meta/>等不需要成对结尾标签未写‘/’
一些不需要成对的标签<meta/> <img/>d等使用bs4的css选择器时出现的情况: 选择某一标签,输出内容超出范围过多 from bs4 import Beautifu ...
python 之 BeautifulSoup标签查找与信息提取
一. 查找a标签 (1)查找所有a标签 >>> for x in soup.find_all('a'): print(x) <a class="sister" ...
【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签，遍历各标签的数据
xml文档: <GetMatchingProductResult ASIN="B071LF9R6G" status="Success">...< ...

随机推荐

iOS9下的Map Kit View下的使用
最近有个任务是关于地理位置上的标注开发,经过一些资料的查找和对比,现总结一些经验,给读者也是给自己. iOS9下的Map Kit View实际是以前MapKit,只不过换了一个名字,实际是指同一个UI ...
不会用数据可视化大屏？一招教你轻松使用数据可视化BI软件创建农业公司运营数据分析大屏
灯果数据可视化BI软件是新一代人工智能数据可视化大屏软件,内置丰富的大屏模板,可视化编辑操作,无需任何经验就可以创建属于你自己的大屏.大家可以在他们的官网下载软件. 本文以农业公司运营数据分析大屏 ...
让$(window).scroll()监听事件只执行一次
可以用jQuery中的unbind()来进行事件解绑. $(window).scroll(function() { console.log("滚离顶部" + $(document) ...
Objective-C编程 — 类和继承
讲述面向对象中的一个重要概念——继承,使用继承可以方便地在已有类的基础上进行扩展,定义一个具有父类全部功能的新类. 父类和子类我们在定义一个新类的时候,经常会遇到要定义的新类是某个类的扩展或者是 ...
剑指offer-字符的所有组合，复制复杂链表，二叉树中和为某一值的路径
字符的所有组合描述: 输入一个字符串,求这个字符串中的字符的所有组合.如:"abc",组合为"a" "b" c" "a ...
二、Nginx配置实例
Nginx配置实例一.反向代理实例一 1.实现效果打开浏览器,在浏览器地址栏输入地址 www.123.com ,跳转到linux系统tomcat主页面中. 2.准备工作在linux系统中安装t ...
区块链 POS和POW的区别
如果你是一名资深的比特币矿工或商人,你一定听说过POW和POS,否则,很难理解. 读完本文,相信会让你明白,原来,虚拟货币除了挖矿,还有利息! 第一段:通俗的概念解析 POW:全称Proof of W ...
Linux系统的安装和常用命令
(1)切换到目录 /usr/bin: (2)查看目录/usr/local 下所有的文件: (3)进入/usr 目录,创建一个名为 test 的目录,并查看有多少目录存在: (4)在/usr 下新建目录 ...
C#画图之饼图
public JsonResult DrawPie() { // 预置颜色 List<Color> colors = new List<Color>() { Color.Fro ...
【React Native】集成声网Agora语音通讯
前言: 公司的产品是一款基于社交的内容聊天软件,需要集成语音通讯功能,在写iOS原生项目时,用到的就是Agora SDK,现在写React Native也直接采用了Agora的库. 集成iOS.And ...

[Python]BeautifulSoup标签的遍历

[Python]BeautifulSoup标签的遍历的更多相关文章

随机推荐

热门专题