分布式 概念: 需要搭建一个分布式的机群, 然后在每一台电脑中执行同一组程序, 让其对某一网站的数据进行联合分布爬取. 原生的scrapy框架不能实现分布式的原因 调度器不能被共享, 管道也不能被共享. scrapy + scrapy-redis 可以实现分布式 scrapy-redis组件的作用: 可以提供可被共享的调度器和管道 特性: 数据只可以存储到redis数据库中 分布式的实现流程: 安装组件pip install scrapy-redis 创建scrapy工程 cd 工程目录中 创建…