在前面两篇文章介绍了下载器中间件的使用,这篇文章将会介绍爬虫中间件(Spider Middleware)的使用. 爬虫中间件 爬虫中间件的用法与下载器中间件非常相似,只是它们的作用对象不同.下载器中间件的作用对象是请求request和返回response:爬虫中间件的作用对象是爬虫,更具体地来说,就是写在spiders文件夹下面的各个文件.它们的关系,在Scrapy的数据流图上可以很好地区分开来,如下图所示. 其中,4.5表示下载器中间件,6.7表示爬虫中间件.爬虫中间件会在以下几种情况被调用.…