以下命令都是在CMD中运行,首先把路径定位到项目文件夹

------------------------------------------------------------------------------------------

1. 创建一个scrapy project

scrapy startproject project_name

--------------------------------------------------------------------------------------------

------------------------------------------------------------------------------------------

2. 自动生成spider代码命令

首先进入项目目录,然后敲入如下命令

scrapy genspider spider_name start_url

------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

3. 列出项目中所有spider

scrapy list

返回项目中所有爬虫的名字

-------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------

4. 运行一个scrapy project,并且保存结果到csv文件

scrapy crawl spider_name -o file.csv

会通过yield命令生成iteration generator,把数据保存到file.csv文件中

---------------------------------------------------------------------------------------------

English Version

The Below commands will run at CMD which included python path in system env path.

Before run the commands, navigate to the directory where you want to create Scrapy project.

------------------------------------------------------------------------------------------

1. Createa a Scrapy project

scrapy startproject project_name

--------------------------------------------------------------------------------------------

------------------------------------------------------------------------------------------

2. Create a spider. It will create a spider sub-class in your source code based on template.

Navigete to project directory, then key in below command

scrapy genspider spider_name start_url

------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

3. List all spiders in your project

scrapy list

It will return all spiders with spider name

-------------------------------------------------------------------------------------------

---------------------------------------------------------------------------------------

4. Run a Scrapy project and save the result set into a CSV file.

scrapy crawl spider_name -o file.csv -t csv

Scrapy framework will make a iteration generator thru yield command in code and save your data into file.csv

---------------------------------------------------------------------------------------------

scrapy常用命令(持续) | Commonly used Scrapy command list (con't)的更多相关文章

  1. scrapy常用命令

    终端命令 创建一个项目: scrapy startproject name 利用蜘蛛名创建一个py文件: scrapy genspider name domain.name 在终端运行:scrapy ...

  2. Appium无线连接安卓终端方法 + ADB Shell常用命令(持续更新)

    ADB无线连接手机的方法1)手机与PC有线相连 - 检查是否连接正常: adb devices - 执行以下命令:adb tcpip 5555 # 当前9001       - 成功提示:restar ...

  3. python常用命令(持续) | Commonly used Python command list (con't)

    ---------------------------------------------------------------------------------------------------- ...

  4. Scrapy常用命令行工具

    查看所有命令 scrapy -h 查看帮助信息 scapy --help 查看版本信息 (venv)ql@ql:~$ scrapy version Scrapy 1.1.2 (venv)ql@ql:~ ...

  5. Centos 常用命令[持续积累中...]

    CentOS常用到的查看系统命令 uname -a cat /etc/issue /sbin/ifconfig # 查看内核/操作系统/CPU信息 head -n 1 /etc/issue # 查看操 ...

  6. Linux常用命令(持续更新中)

    cd 目录名 :进入某个目录 ls :列出当前目录的内容 locate 文件名/目录名:寻找文件.目录 find 目录名1 -name 文件名/目录名2 :在目录1中寻找目录2 whereis  文件 ...

  7. Linux常用命令——持续更新(2018-05-09)

    此命令默认是在centos环境下执行,除非特殊标明. 1.查看ip: ifconfig 2.创建指定用户并分配到某个组:创建用户user并分配到root组 useradd -g root user 3 ...

  8. linux常用命令---持续添加中...

    1.cp -r  源文件夹  目的文件夹   // -r 可递归所有子目录及文件 2.grep -r 查找内容 ./*    //递归查找当前目录下所有文件指定内容 3. 查看系统运行时间 who - ...

  9. docker-compose常用命令(持续更新...)

    build 构建或重建服务 help 命令帮助 kill 杀掉容器 logs 显示容器的输出内容 port 打印绑定的开放端口 ps 显示容器 pull 拉取服务镜像 restart 重启服务 rm ...

随机推荐

  1. MySql使用存储过程实现事务的提交或者回滚

    DELIMITER $$ DROP PROCEDURE IF EXISTS test_sp1 $$ CREATE PROCEDURE test_sp1( ) BEGIN ; ; START TRANS ...

  2. 第四十四条:为所有导出的API元素编写文档注释

    简而言之,要为API编写文档,文档注释是最好,最有效的途径.对于所有可导出的API元素来说,使用文档注释应该被看作是强制性的.要 采用一致的风格来遵循标准的约定.记住,在文档注释内部出现任何的HTML ...

  3. [Cerc2013]Magical GCD

    https://vjudge.net/problem/UVA-1642 题意:在一个序列中,找出一段连续的序列,使得长度*gcd最大 固定右端点,当左端点从左向右移动时,gcd不变或变大 gcd相同时 ...

  4. Python内置函数(3)——max

    英文文档: max(iterable, *[, key, default]) max(arg1, arg2, *args[, key]) Return the largest item in an i ...

  5. python subprocess模块使用总结

    一.subprocess以及常用的封装函数运行python的时候,我们都是在创建并运行一个进程.像Linux进程那样,一个进程可以fork一个子进程,并让这个子进程exec另外一个程序.在Python ...

  6. react-native-image-picker 运用launchCamera直接调取摄像头的缺陷及修复

    在前几天用react-native进行android版本开发当中,用到了"react-native-image-picker"的插件:根据业务的需求:点击按钮-->直接调取摄 ...

  7. maven 每次update后影响接口实现类的问题

    遇到maven每次update后,就会更改eclipse中java Compiler中的jdk compliance版本 <plugin> <groupId>org.apach ...

  8. restful架构风格设计准则(四)资源表示和资源访问

    读书笔记,原文链接:http://www.cnblogs.com/loveis715/p/4669091.html,感谢作者! 一.资源表示 1.资源表示:使用 单数 vs. 复数 如果一个URL所对 ...

  9. GIT入门笔记(11)- 多种撤销修改场景和对策--实战练习

    1.检查发现目前没有变化$ git statusOn branch masternothing to commit, working tree clean $ cat lsq.txt2222 2.修改 ...

  10. 使用TortoiseSVN打Tag

    参考了 https://blog.csdn.net/liuzx32/article/details/9123401. 值得注意的点是: 选择路径的时候,不要先点进去自己建好叶子节点路径再选择该路径,会 ...