Scrapy简介 Scrapy是用纯Python实现一个为了爬取网站数据.提取结构性数据而编写的应用框架,用途非常广泛.框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便. Scrapy Engine(引擎) : 负责 Spider . ItemPipeline . Downloader . Scheduler 中间的通讯,信号.数据传递等. Scheduler(调度器) : 它负责接受 引擎 发送过来的Request请求,并按照一定的方式进…