本篇简单介绍 xml 在python爬虫方面的使用，想要具体学习 xml 可以到 w3school 查看 xml 文档

xml 文档链接：http://www.w3school.com.cn/xmldom/xmldom_reference.asp

Python爬虫教程-20-xml简介

XML(Extensible Markup Language) 可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。
用途：它被设计用来传输和存储数据

简单的概念：

结点

结点：XML 文档中的每个成分都是一个节点
整个文档是一个文档节点
每个 XML 标签是一个元素节点
包含在 XML 元素中的文本是文本节点
每一个 XML 属性是一个属性节点
注释属于注释节点
xml案例py28.xml文件：https://xpwi.github.io/py/py爬虫/py28.xml

<?xml version="1.0" encoding="UTF-8" ?>

<booksore>

    <book category="cooking">

        <title lang="en">Everyday Italian</title>

        <auther>Gidada De</auther>

        <year>2018</year>

        <price>23</price>

    </book>

    <book category="education">

        <title lang="en">Python is Python</title>

        <auther>Food War</auther>

        <year>2008</year>

        <price>83</price>

    </book>

    <book category="sport">

        <title lang="en">Running</title>

        <auther>Klaus Kuka</auther>

        <year>2010</year>

        <price>43</price>

    </book>

</booksore>

在上面的 XML 中，根节点是。文档中的所有其他节点都被包含在中
根节点有3个节点：
第一个节点有4个节点：, , 以及，其中每个节点都包含一个文本节点，"Everyday Italian", "Gidada De", "2018" 以及 "23"

其他就不介绍了，附上链接

XML文档

结点操作

自行查看文档就可以 http://www.w3school.com.cn/xmldom/dom_intro.asp

更多文章链接：Python 爬虫随笔

- 本笔记不允许任何个人和组织转载

Python爬虫教程-20-xml 简介的更多相关文章

Python爬虫教程-21-xpath 简介
本篇简单介绍 xpath 在python爬虫方面的使用,想要具体学习 xpath 可以到 w3school 查看 xpath 文档 xpath文档:http://www.w3school.com.cn ...
Python爬虫教程-01-爬虫介绍
Spider-01-爬虫介绍 Python 爬虫的知识量不是特别大,但是需要不停和网页打交道,每个网页情况都有所差异,所以对应变能力有些要求爬虫准备工作参考资料精通Python爬虫框架Scrap ...
Python爬虫教程-00-写在前面
鉴于好多人想学Python爬虫,缺没有简单易学的教程,我将在CSDN和大家分享Python爬虫的学习笔记,不定期更新基础要求 Python 基础知识 Python 的基础知识,大家可以去菜鸟教程进行 ...
Python爬虫教程-32-Scrapy 爬虫框架项目 Settings.py 介绍
本篇介绍项目开发的过程中,对 Setting 文件的配置和使用 Python爬虫教程-32-Scrapy 爬虫框架项目 Settings.py 介绍 settings.py 文件的使用想要详细查看 ...
Python爬虫教程-26-Selenium + PhantomJS
Python爬虫教程-26-Selenium + PhantomJS 动态前端页面 : JavaScript: JavaScript一种直译式脚本语言,是一种动态类型.弱类型.基于原型的语言,内置支持 ...
Python爬虫教程-22-lxml-etree和xpath配合使用
Python爬虫教程-22-lxml-etree和xpath配合使用 lxml:python 的HTML/XML的解析器官网文档:https://lxml.de/ 使用前,需要安装安 lxml 包 ...
Python爬虫教程-18-页面解析和数据提取
本篇针对的数据是已经存在在页面上的数据,不包括动态生成的数据,今天是对HTML中提取对我们有用的数据,去除无用的数据 Python爬虫教程-18-页面解析和数据提取结构化数据:先有的结构,再谈数据 ...
Python爬虫教程-17-ajax爬取实例（豆瓣电影）
Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互对于ajax: ...
Python爬虫教程-12-爬虫使用cookie爬取登录后的页面(人人网)（上）
Python爬虫教程-12-爬虫使用cookie(上) 爬虫关于cookie和session,由于http协议无记忆性,比如说登录淘宝网站的浏览记录,下次打开是不能直接记忆下来的,后来就有了cooki ...

随机推荐

接口自动化之 unittest+ddt+openpyxl 综合
前面写过python 之 unittest初探和 python 之 unittest+ddt 两篇文章.在之前的文章中,写过可以再次优化.今天写第三篇的目的,就是在原有基础上,基于 openpyxl ...
知了课堂 Python Flask零基础笔记整理
目录起步安装Python2.7: Python虚拟环境介绍与安装: pip安装flask: 认识url: URL详解 web服务器和应用服务器以及web应用框架: Flask 第一个flask程序 ...
[转] docker 部署 odoo
[From] https://blog.csdn.net/qq_36178641/article/details/79775153 1.安装大象数据库. docker run -d -e POSTGR ...
Android开发多媒体应用之SoundPool的使用的代码
内容过程中,把写内容过程中比较好的内容段记录起来,下面的内容是关于Android开发多媒体应用之SoundPool的使用的内容,希望对各位也有用途. public class MainActivity ...
ios模拟器安装测试包方法
1. 使用ios-sim ios-sim是一个可以用命令空着ios模拟器的工具.利用这个命令,我们可以启动模拟器.安装app.启动app.查询ios sdk,它可以使我们像自动化测试一样打开xcode ...
GoldenGate安装配置
GOLDENGATE安装 1. 下载与数据库对应版本的goldengate安装介质. 2. 创建goldengate系统用户,设置用户环境变量,如果是oracle,建议直接使用oracle作为用户安装 ...
Linux-文件目录类命令
l 文件目录类 pwd 指令基本语法 pwd (功能描述:显示当前工作目录的绝对路径) 应用实例案例:显示当前工作目录的绝对路径 ls指令基本语法 ls [选项] [目录或是文件] 常用选项 - ...
How to remove constantly launching services on Mac OS X
Even after you uninstall it, some Mac OS X software just won’t quit nagging you or notifying you of ...
再探php
1. 如何打开一个php文件? 启动本地服务器和MySQL, 然后将php文件放在xampp -> htdocs 目录下(可以是子目录.孙子目录 ......),打开浏览器,在浏览器中输入 l ...
ubuntu中ANT的安装和配置
一. 自动安装可以使用sudo apt-get install ant安装,但是这种装法不好.首先安装的ant不是最新的版本,其次还要装一堆其他的附带的东西.所以我才用自己手动ant安装. 二. 手动 ...

Python爬虫教程-20-xml 简介

Python爬虫教程-20-xml简介

简单的概念：

结点

XML文档

结点操作

更多文章链接：Python 爬虫随笔

Python爬虫教程-20-xml 简介的更多相关文章

随机推荐

热门专题