1.Spider爬虫代码 # -*- coding: utf-8 -*- import scrapy from yszd.items import YszdItem class YszdSpiderSpider(scrapy.Spider): # 爬虫名称,启动爬虫时必须的参数 name = 'yszd_spider' # 爬取域范围,运行爬虫在这个域名下爬取数据(可选) allowed_domains = ['itcast.cn'] # 起始url列表,爬虫执行后第一批请求将从这个列表里获取…