scrapy_css
css选择器标准格式:reponse.css(css选择器::获取值)
css选择器有哪些?
* 选择所有节点
#id 选择id的节点
.container 选取所有class包含container的节点
li a 选取所有li元素下的所有a节点
ul + p 选取ul后面的第一个p元素
div#container > ul 选取所有id = container的div元素下第一个ul子元素
ul ~ p 选择 ul 相邻的所有p元素
a[title] 选取所有有title属性的a元素
a[href=’域名’] 选取所有有href=’域名’ 属性的a元素
a[href*=’字符串’] 选取所有href属性值 包含 指定字符串 的a元素,注意 * 号
a[href^=’字符串’] 选取所有href属性值 不包含 指定字符串 的a元素,注意 ^ 号
a[href$=’字符串’] 选取所有href属性值以 指定字符串结尾 的a元素,注意 $ 号
input[type=radio]:checked 选取选中的radio元素
div:not(#container) 选取id!= container的所有div元素
li:nth-child(3) 选取第三个li元素
tr:nth-child(2n) 第偶数个tr元素
如何使用css选择器?
和css选择器一样
response.css(‘选择器::获取内容’)
如何获取内容 ::text
如何获得属性值 ::attr(属性key)
对于有两个class属性值该如何进行选择?
response.css('.class1.class2') 直接拼接在一起,不用空格
scrapy_css的更多相关文章
随机推荐
- 云计算之路-阿里云上: RDS实例CPU跑满引发的故障
今天上午 10: 40 左右,我们所使用的阿里云 RDS 实例的 CPU 突然飙高到近 100% ,造成大量数据库查询操作缓慢.超时,在这个恶劣条件下大量 memcached 缓存无法建立,这样的雪上 ...
- CMDB运维开发项目
ITIL:Information Technology Infrastructure Library 信息技术基础架构库,主要适用于IT服务管理(ITSM).ITIL为企业的IT服务管理实践提供了一个 ...
- 001_JS基础_JavaScript简介
1.1 历史 JS的发展历史: http://www.w3school.com.cn/js/pro_js_history.asp 1.2 JavaScript简介 以下摘自维基百科对javascrip ...
- ionic 横向滚动 ion-scroll 进度条(步骤)// 根据后台数据控制当前默认滑动到的位置
<ion-scroll zooming="false" direction="x" style="width: 100%;" scro ...
- Spring Boot修改启动端口
spring boot是个好东西,可以不用容器直接在main方法中启动,而且无需配置文件,方便快速搭建环境.可是当我们要同时启动2个springboot工程时,就会有问题,有可能会因为8080端口被第 ...
- Linux进程管理描述符 task_struct
转:http://blog.csdn.net/hongchangfirst/article/details/7075026 大家都知道进程,可是知道linux是怎么管理其进程的吗?每一个进程都有一个进 ...
- linux连接mysql 出现Access denied for user 'root'@'localhost'(using password: YES)错误解决方案
linux连接mysql /usr/local/mysql/bin/mysql -uroot -p 输入密码出现Access denied for user 'root'@'localhost'(us ...
- 枚举 输入流重载>> C++
语言:C++ 我们可能会遇到这种情况:自己定义了一个枚举类型,但是却不知道如何重载输入流,使我们定义的枚举用起来不是很方便. 那么,如何去重载呢,我们先来看一下内置类型的测试过程: #include& ...
- Gym 100952F&&2015 HIAST Collegiate Programming Contest F. Contestants Ranking【BFS+STL乱搞(map+vector)+优先队列】
F. Contestants Ranking time limit per test:1 second memory limit per test:24 megabytes input:standar ...
- POJ2689-Prime Distance-区间筛素数
最近改自己的错误代码改到要上天,心累. 这是迄今为止写的最心累的博客. Prime Distance Time Limit: 1000MS Memory Limit: 65536K Total S ...