本例子用命令行调试的方式,演示如何获取页面的特定信息: 0) 示例页面 1) 使用scrapy shell获取目标页面: scrapy shell http://bj.lianjia.com/ershoufang/pg1tt2/ 2)找到提取路径 在页面(本例中使用谷歌浏览器)用F12查看代码,找到要提取目标字段,如第一个房源的地址,在工具下栏有一个css的"路径": html body div div ul.sellListContent li.clear div.info.clea
使用爬取http://quotes.toscrape.com/内容,网站内容很简单 一. 使用scrapy创建项目 scrapy startproject myscrapy1 scrapy genspider quotes 二. 修改items.py和quotes.py items.py用来保存爬取的数据,和字典的使用方法一样 import scrapy class Myscrapy1Item(scrapy.Item): # define the fields for your item her