scrapy常用命令（持续） | Commonly used Scrapy command list (con't)

以下命令都是在CMD中运行，首先把路径定位到项目文件夹

------------------------------------------------------------------------------------------

1. 创建一个scrapy project

scrapy startproject project_name

--------------------------------------------------------------------------------------------

------------------------------------------------------------------------------------------

2. 自动生成spider代码命令

首先进入项目目录，然后敲入如下命令

scrapy genspider spider_name start_url

------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

3. 列出项目中所有spider

scrapy list

返回项目中所有爬虫的名字

-------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------

4. 运行一个scrapy project,并且保存结果到csv文件

scrapy crawl spider_name -o file.csv

会通过yield命令生成iteration generator，把数据保存到file.csv文件中

---------------------------------------------------------------------------------------------

English Version

The Below commands will run at CMD which included python path in system env path.

Before run the commands, navigate to the directory where you want to create Scrapy project.

------------------------------------------------------------------------------------------

1. Createa a Scrapy project

scrapy startproject project_name

--------------------------------------------------------------------------------------------

------------------------------------------------------------------------------------------

2. Create a spider. It will create a spider sub-class in your source code based on template.

Navigete to project directory, then key in below command

scrapy genspider spider_name start_url

------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

3. List all spiders in your project

scrapy list

It will return all spiders with spider name

-------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------

4. Run a Scrapy project and save the result set into a CSV file.

scrapy crawl spider_name -o file.csv -t csv

Scrapy framework will make a iteration generator thru yield command in code and save your data into file.csv

---------------------------------------------------------------------------------------------

scrapy常用命令（持续） | Commonly used Scrapy command list (con't)的更多相关文章

scrapy常用命令
终端命令创建一个项目: scrapy startproject name 利用蜘蛛名创建一个py文件: scrapy genspider name domain.name 在终端运行:scrapy ...
Appium无线连接安卓终端方法 + ADB Shell常用命令(持续更新)
ADB无线连接手机的方法1)手机与PC有线相连 - 检查是否连接正常: adb devices - 执行以下命令:adb tcpip 5555 # 当前9001 - 成功提示:restar ...
python常用命令（持续） | Commonly used Python command list (con't)
---------------------------------------------------------------------------------------------------- ...
Scrapy常用命令行工具
查看所有命令 scrapy -h 查看帮助信息 scapy --help 查看版本信息 (venv)ql@ql:~$ scrapy version Scrapy 1.1.2 (venv)ql@ql:~ ...
Centos 常用命令[持续积累中...]
CentOS常用到的查看系统命令 uname -a cat /etc/issue /sbin/ifconfig # 查看内核/操作系统/CPU信息 head -n 1 /etc/issue # 查看操 ...
Linux常用命令(持续更新中)
cd 目录名 :进入某个目录 ls :列出当前目录的内容 locate 文件名/目录名:寻找文件.目录 find 目录名1 -name 文件名/目录名2 :在目录1中寻找目录2 whereis 文件 ...
Linux常用命令——持续更新（2018-05-09）
此命令默认是在centos环境下执行,除非特殊标明. 1.查看ip: ifconfig 2.创建指定用户并分配到某个组:创建用户user并分配到root组 useradd -g root user 3 ...
linux常用命令---持续添加中...
1.cp -r 源文件夹目的文件夹 // -r 可递归所有子目录及文件 2.grep -r 查找内容 ./* //递归查找当前目录下所有文件指定内容 3. 查看系统运行时间 who - ...
docker-compose常用命令(持续更新...)
build 构建或重建服务 help 命令帮助 kill 杀掉容器 logs 显示容器的输出内容 port 打印绑定的开放端口 ps 显示容器 pull 拉取服务镜像 restart 重启服务 rm ...

随机推荐

从同步阻塞聊到Java三种IO方式
本文总结自 https://zhuanlan.zhihu.com/p/34408883, https://www.zhihu.com/question/19732473中愚抄的回答, http://b ...
JAVA_SE基础——28.封装
黑马程序员blog... 面向对象三大特征:1. 封装2. 继承3 多态. 今天我们先学习第一大特征,封装. 封装:是指隐藏对象的属性和实现细节,仅对外提供公共访问方式. 好处: 1. 将变 ...
LeetCode & Q26-Remove Duplicates from Sorted Array-Easy
Descriptions: Given a sorted array, remove the duplicates in place such that each element appear onl ...
Python内置函数(34)——map
英文文档: map(function, iterable, ...) Return an iterator that applies function to every item of iterabl ...
httpClient解决post请求重定向的问题
import com.dadi.saas.util.HTTPUtils; import org.apache.commons.httpclient.Header; import org.apache. ...
redis入门（03）redis的配置
一.配置文件 Redis 的配置文件位于 Redis 安装目录下,文件名为 redis.conf.你可以通过 CONFIG 命令查看或设置配置项. 二.查看修改 1.查看配置 1.1.vi redis ...
新概念英语（1-61）A bad cold
新概念英语(1-61)A bad cold What is good news for Jimmy? A:Where's Jimmy? B:He's in bed. A:What's the matt ...
.net 4种单例模式
转载: https://www.cnblogs.com/dreign/archive/2012/05/08/2490212.html using System; using System.Collec ...
python 开发之路 - 入门
一. python 介绍 Python是著名的"龟叔"Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言.1991年发布Python ...
zoj 3981 Balloon Robot
https://vjudge.net/problem/ZOJ-3981 题意: 有m个座位,其中n个队伍坐在这些位置上,一个队伍一个座位.当一个队A了题之后,他们们会得到气球,假设他们在a时刻A题,但 ...

scrapy常用命令（持续） | Commonly used Scrapy command list (con't)

scrapy常用命令（持续） | Commonly used Scrapy command list (con't)的更多相关文章

随机推荐

热门专题