1. 使用cmd+R命令进入命令行窗口,并进入你需要创建项目的目录 cd 项目地址 2. 创建项目 scrapy startproject <项目名> cd <项目名> 例如 scrapy startproject quote cd quote 3. 编写item.py文件(定义需要爬取的文件) import scrapy class QuoteItem(scrapy.Item): # define the fields for your item here like: text
Scrapy爬虫大战京东商城 引言 上一篇已经讲过怎样获取链接,怎样获得参数了,详情请看python爬取京东商城普通篇 代码详解 首先应该构造请求,这里使用scrapy.Request,这个方法默认调用的是start_urls构造请求,如果要改变默认的请求,那么必须重载该方法,这个方法的返回值必须是一个可迭代的对象,一般是用yield返回,代码如下: def start_requests(self): for i in range(1,101): page=i*2-1 #这里是构造请求url的p