Python3 scrapy 新手命令
基本命令
建立项目
scrapy startproject projectname #在CMD命令框内执行,路径是你需要保存的位置 建立爬虫
cd projectname #在CMD命令框内执行,目的是建立py文件,必须cd进入到爬虫项目文件夹才可以用
scrapy genspider spidername xxx.com #名字是自己取得,后面是爬取得初始网址,这一步可以在后续修改 调试爬虫
scrapy shell 网址 #网址输入需要调试的网址,scrapy会自动获取页面用来调试,自动获得一个response的返回值就是页面代码
运行爬虫
scrapy crawl spidername #运行爬虫,不保存信息
scrapy crawl spidername -o quotes.json #常用这种
scrapy crawl spidername -o quotes.jl
scrapy crawl spidername -o quotes.csv
scrapy crawl spidername -o quotes.xml #网页源代码格式 停止爬虫
CTRL C
Python3 scrapy 新手命令的更多相关文章
- python3 scrapy+Crontab部署过程
		背景 最近有时间想学习下python3+scrapy,于是决定写一个小程序来练练手. 开发环境:MacOS High Sierra(10.13.1)+python3+scrapy. 开发工具:PyCh ... 
- 在Scrapy项目【内外】使用scrapy shell命令抓取 某网站首页的初步情况
		Windows 10家庭中文版,Python 3.6.3,Scrapy 1.5.0, 时隔一月,再次玩Scrapy项目,希望这次可以玩的更进一步. 本文展示使用在 Scrapy项目内.项目外scrap ... 
- scrapy shell命令的【选项】简介
		在使用scrapy shell测试某网站时,其返回400 Bad Request,那么,更改User-Agent请求头信息再试. DEBUG: Crawled () <GET https://w ... 
- Python3 Scrapy 安装方法
		Python3 Scrapy 安装方法 (一脸辛酸泪) 写在前面 最近在学习爬虫,在熟悉了Python语言和BeautifulSoup4后打算下个爬虫框架试试. 没想到啊,这坑太深了... 看了看相关 ... 
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
		试想一下,前面做的实验和例子都只有一个spider.然而,现实的开发的爬虫肯定不止一个.既然这样,那么就会有如下几个问题:1.在同一个项目中怎么创建多个爬虫的呢?2.多个爬虫的时候是怎么将他们运行起来 ... 
- Scrapy常用命令行工具
		查看所有命令 scrapy -h 查看帮助信息 scapy --help 查看版本信息 (venv)ql@ql:~$ scrapy version Scrapy 1.1.2 (venv)ql@ql:~ ... 
- linux升级python3.6相关命令
		sudo apt-get install python3.6 sudo update-alternatives --install /usr/bin/python python /usr/bin/py ... 
- scrapy的命令行
		scrapy --help 列出帮助信息以及常用命令scrapy version 列出scrapy版本scrapy version -v 列出详细的scrapy版本以及各组件信息 scrapy sta ... 
- scrapy常用命令(持续) | Commonly used Scrapy command list (con't)
		以下命令都是在CMD中运行,首先把路径定位到项目文件夹 ------------------------------------------------------------------------ ... 
随机推荐
- 无归档情况下使用BBED处理ORA-01113错误
			在丢失归档情况下,恢复时常会遇到ora-01113错误,以下实验模拟表空间offline,然后在丢失归档文件的情况下使用BBED修改文件头信息,最后恢复数据文件: 数据库版本: SQL> sel ... 
- 一起做RGB-D SLAM (3)
			第三讲 特征提取与配准 2016.11 更新 把原文的SIFT替换成了ORB,这样你可以在没有nonfree模块下使用本程序了. OpenCV可以使用 apt-get install libopenc ... 
- 'for each' statements are only available if source level is 5.0
			在用foreach的时候,出现以下错误: 错误:Syntax error, 'for each' statements are only available if source level is 5. ... 
- 设计模式12---享元模式(Flyweight  Pattern)
			享元模式 定义:共享元对象,运用共享技术有效地支持大量细粒度对象的复用.如果在一个系统中存在多个相同的对象,那么只需要共享一份对象的拷贝,而不必为每一次使用创建新的对象. 享元模式是为数不多的.只为提 ... 
- CentOS下安装PHP的AMQP扩展方法和步骤
			AMQP,即Advanced Message Queuing Protocol,一个提供统一消息服务的应用层标准高级消息队列协议,是应用层协议的一个开放标准,为面向消息的中间件设计.基于此协议的客户端 ... 
- opencv——拟合圆
			#include "stdafx.h" #include "cv.h" #include "highgui.h" #include &quo ... 
- JulyNovel-React
			写在前面的话 目前,JulyNovel后端框架基本搭建.部署完毕,GraphQL提供的API接口也有着高可用性,数据库里也存了六七百兆爬来的小说数据,是时候开始写前端了. 框架选用 JulyNovel ... 
- [网络流24题][CTSC1999] 家园
			题目链接:戳我 对于这种一个点(表面意义上的一个点,比如说一个位置)对应多种情况的(比如说随着时间的推移有着不同的状态,而且这种状态>2),我们考虑在类似于分层图上面跑网络流. 比如说这道题,周 ... 
- nowcoder(牛客网)普及组模拟赛第一场 解题报告
			蒟蒻我可能考了一场假试 T1 绩点 这题没什么好说的,应该是只要会语言的就会做. T2 巨大的棋盘 一个模拟题吧qwq,但是要注意取模的时候先加上n或者m再取模,要不然会错的. #include< ... 
- WebGL 一
			WebGL绘制窗口 <html><head><title>OpenGL Test</title> </head><body>&l ... 
