[爬虫]1.2.2 CSS选择器

博客0214 2025-10-07 10:08:23 原文

CSS (Cascading Style Sheets) 是一种样式表语言，用于描述HTML元素的样式。CSS选择器是CSS规则的一部分，它决定了CSS规则应用于哪些元素。在网络爬虫的开发中，我们经常使用CSS选择器来定位和选取HTML元素。

以下是一些常见的CSS选择器：

1. 元素选择器

元素选择器选择所有给定的HTML元素。

例如，以下的CSS规则将会应用在所有的<p>标签上，使得所有的段落文字颜色为蓝色：

p {

    color: blue;

}

2. ID选择器

ID选择器可以选择一个唯一的元素。ID选择器通过井号#开头，后跟元素的ID来定义。

例如，以下的CSS规则将会应用在ID为my-id的元素上，使得该元素的文字颜色为红色：

#my-id {

    color: red;

}

对应的HTML元素可能如下所示：

<p id="my-id">这段文字将会是红色的。</p>

3. 类选择器

类选择器可以选择一个或多个元素。类选择器通过英文句点.开头，后跟元素的类名来定义。

例如，以下的CSS规则将会应用在类为my-class的所有元素上，使得这些元素的文字颜色为绿色：

.my-class {

    color: green;

}

对应的HTML元素可能如下所示：

<p class="my-class">这段文字将会是绿色的。</p>

<div class="my-class">这段文字也将会是绿色的。</div>

4. 属性选择器

属性选择器可以选择具有给定属性的元素。

例如，以下的CSS规则将会应用在所有具有target属性的<a>标签上，使得这些链接的文字颜色为紫色：

a[target] {

    color: purple;

}

对应的HTML元素可能如下所示：

<a href="https://www.example.com" target="_blank">这个链接的文字将会是紫色的。</a>

5. 组合选择器

你也可以组合使用上述选择器，创建更复杂的选择规则。例如，你可以选择ID为my-id的元素中的所有<p>标签，或者选择类为my-class的元素中的所有具有target属性的<a>标签。

#my-id p {

    color: orange;

}

.my-class a[target] {

    color: pink;

}

以上就是CSS选择器的基础知识。CSS选择器是网络爬虫开发中的一项重要技能，掌握它可以让你更高效地定位和选取HTML元素。

推荐阅读：

https://mp.weixin.qq.com/s/dV2JzXfgjDdCmWRmE0glDA

https://mp.weixin.qq.com/s/an83QZOWXHqll3SGPYTL5g

[爬虫]1.2.2 CSS选择器的更多相关文章

【网络爬虫入门04】彻底掌握BeautifulSoup的CSS选择器
[网络爬虫入门04]彻底掌握BeautifulSoup的CSS选择器广东职业技术学院欧浩源 2017-10-21 1.引言目前,除了官方文档之外,市面上及网络详细介绍BeautifulSoup ...
第三百四十节，Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器
第三百四十节,Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器 css选择器 1. 2. 3. ::attr()获取元素属性,css选择器 ::text获取标签文本举例: extr ...
pyspider 爬虫教程（一）：HTML 和 CSS 选择器
虽然以前写过如何抓取WEB页面和如何从 WEB 页面中提取信息.但是感觉还是需要一篇 step by step 的教程,不然没有一个总体的认识.不过,没想到这个教程居然会变成一篇译文,在这个 ...
十九 Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器
css选择器 1. 2. 3. ::attr()获取元素属性,css选择器 ::text获取标签文本举例: extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如 ...
爬虫学习笔记（2）--创建scrapy项目&&css选择器
一.手动创建scrapy项目---------------- 安装scrapy: pip install -i https://pypi.douban.com/simple/ scrapy 1 ...
初始scrapy,简单项目创建和CSS选择器,xpath选择器(1)
一安装 #Linux: pip3 install scrapy #Windows: a. pip3 install wheel b. 下载twisted http://www.lfd.uci.edu ...
潭州课堂25班：Ph201805201 爬虫基础第六课选择器 (课堂笔记)
HTML解析库BeautifulSoup4 BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库,它的使用方式相对于正则来说更加的简单方便,常常能够节省我们大量的时间 ...
使用 CSS 选择器从网页中提取数据
在 R 中,关于网络爬虫最简单易用的扩展包是 rvest.运行以下代码从 CRAN 上安装:install.packages("rvest")首先,加载包并用 read_html( ...
爬虫常用Xpath和CSS3选择器对比
爬虫常用Xpath和CSS3选择器对比 1. 简介 CSS是来配合HTML工作的,和Xpath对比起来,CSS选择器通常都比较短小,但是功能不够强大.CSS中的空白符' '和Xpath的'//'都表示 ...
Spider-Scrapy css选择器提取数据
首先我们来说说css选择器:其实在上面的概述:和scrapy相关的函数就这么三个而已:response.css("css表达式").extract().extract_first( ...

随机推荐

R的基本用法2
title: "Lectures" author: '01' date: "2022-09-23" output: pdf_document knitr::op ...
Typora用法：
Typora用法: 一:标题模板: #+空格+标题名+回车一级标题二级标题三级标题四级标题五级标题二:字体加粗斜体斜体加粗删除线(esc键下面的那个键) 上标:我是上标下表:我 ...
Python 字典嵌套
字典嵌套含义:将一系列字典存储在列表中,或将列表作为值存储在字典中在列表中嵌套字典.在字典中嵌套列表.在字典中嵌套字典字典列表创建多个字典,将字典存放在列表中使用range()自动生成多个字 ...
[Opencv-C++] 3. opencv数据类型
文章目录 Point类 cv::Scalar类 size类 cv::Rect类 cv::RotatedRect类固定矩阵类固定向量类复数类工具函数模板结构 Point类在大多数程序中,Po ...
【Redis】常用命令介绍
一.Redis常用基本命令官方文档:https://redis.io/commands/ 参考文档:http://redisdoc.com/ #可以使用help命令查看各redis命令用法[root ...
【Docker】安装及部署
一.Ubuntu使用apt安装Docker 官方安装文档:https://docs.docker.com/engine/install/ubuntu/ 1.准备安装环境 [root@Docker-Ub ...
聊一聊 dotnet-trace 调查 lock锁竞争
一:背景 1. 讲故事最近在分析一个 linux 上的 dump,最后的诱因是大量的lock锁诱发的高频上下文切换,虽然问题告一段落,但我还想知道一点信息,所谓的高频到底有多高频?锁竞争到底是一个怎 ...
2023-04-17：设计一个包含一些单词的特殊词典，并能够通过前缀和后缀来检索单词。实现 WordFilter 类： WordFilter(string[] words) 使用词典中的单词 wor
2023-04-17:设计一个包含一些单词的特殊词典,并能够通过前缀和后缀来检索单词. 实现 WordFilter 类: WordFilter(string[] words) 使用词典中的单词 wor ...
基于go语言的声明式流式ETL，高性能和弹性流处理器
简要介绍Benthos,并给出若干示例,指导如何安装和运行. Benthos Benthos 是一个开源的.高性能和弹性的数据流处理器,能够以各种代理模式连接各种源和汇,可以帮助用户在不同的消息流之间 ...
React-hooks 父组件通过ref获取子组件数据和方法
我们知道,对于子组件或者节点,如果是class类,存在实例,可以通过 React.createRef() 挂载到节点或者组件上,然后通过 this 获取到该节点或组件. class RefTest e ...