scrapy常用命令(持续) | Commonly used Scrapy command list (con't)
以下命令都是在CMD中运行,首先把路径定位到项目文件夹
------------------------------------------------------------------------------------------
1. 创建一个scrapy project
scrapy startproject project_name
--------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
2. 自动生成spider代码命令
首先进入项目目录,然后敲入如下命令
scrapy genspider spider_name start_url
------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------
3. 列出项目中所有spider
scrapy list
返回项目中所有爬虫的名字
-------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------
4. 运行一个scrapy project,并且保存结果到csv文件
scrapy crawl spider_name -o file.csv
会通过yield命令生成iteration generator,把数据保存到file.csv文件中
---------------------------------------------------------------------------------------------
English Version
The Below commands will run at CMD which included python path in system env path.
Before run the commands, navigate to the directory where you want to create Scrapy project.
------------------------------------------------------------------------------------------
1. Createa a Scrapy project
scrapy startproject project_name
--------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------
2. Create a spider. It will create a spider sub-class in your source code based on template.
Navigete to project directory, then key in below command
scrapy genspider spider_name start_url
------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------
3. List all spiders in your project
scrapy list
It will return all spiders with spider name
-------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------
4. Run a Scrapy project and save the result set into a CSV file.
scrapy crawl spider_name -o file.csv -t csv
Scrapy framework will make a iteration generator thru yield command in code and save your data into file.csv
---------------------------------------------------------------------------------------------
scrapy常用命令(持续) | Commonly used Scrapy command list (con't)的更多相关文章
- scrapy常用命令
终端命令 创建一个项目: scrapy startproject name 利用蜘蛛名创建一个py文件: scrapy genspider name domain.name 在终端运行:scrapy ...
- Appium无线连接安卓终端方法 + ADB Shell常用命令(持续更新)
ADB无线连接手机的方法1)手机与PC有线相连 - 检查是否连接正常: adb devices - 执行以下命令:adb tcpip 5555 # 当前9001 - 成功提示:restar ...
- python常用命令(持续) | Commonly used Python command list (con't)
---------------------------------------------------------------------------------------------------- ...
- Scrapy常用命令行工具
查看所有命令 scrapy -h 查看帮助信息 scapy --help 查看版本信息 (venv)ql@ql:~$ scrapy version Scrapy 1.1.2 (venv)ql@ql:~ ...
- Centos 常用命令[持续积累中...]
CentOS常用到的查看系统命令 uname -a cat /etc/issue /sbin/ifconfig # 查看内核/操作系统/CPU信息 head -n 1 /etc/issue # 查看操 ...
- Linux常用命令(持续更新中)
cd 目录名 :进入某个目录 ls :列出当前目录的内容 locate 文件名/目录名:寻找文件.目录 find 目录名1 -name 文件名/目录名2 :在目录1中寻找目录2 whereis 文件 ...
- Linux常用命令——持续更新(2018-05-09)
此命令默认是在centos环境下执行,除非特殊标明. 1.查看ip: ifconfig 2.创建指定用户并分配到某个组:创建用户user并分配到root组 useradd -g root user 3 ...
- linux常用命令---持续添加中...
1.cp -r 源文件夹 目的文件夹 // -r 可递归所有子目录及文件 2.grep -r 查找内容 ./* //递归查找当前目录下所有文件指定内容 3. 查看系统运行时间 who - ...
- docker-compose常用命令(持续更新...)
build 构建或重建服务 help 命令帮助 kill 杀掉容器 logs 显示容器的输出内容 port 打印绑定的开放端口 ps 显示容器 pull 拉取服务镜像 restart 重启服务 rm ...
随机推荐
- MySQL-压缩版-windows安装
1.首先去dev.mysql.com/downloads/mysql/下载MySQL的压缩包,然后解压到任意盘符下. 2.打开系统变量在Path下追加mysql的路径(例如:C:\mysql-5.7. ...
- zookeeper安装及环境变量设置
下载 首先去官网下载(自行选择版本):http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.11/然后执行tar -zxvf解压 对于后台安装 ...
- 消除ExtJS6的extjs-trila字样
- hexo博客图片问题
hexo博客图片问题 第一步 首先确认_config.yml 中有 post_asset_folder:true. Hexo 提供了一种更方便管理 Asset 的设定:post_asset_folde ...
- VMware-vCenter-Server-Appliance VCSA升级步骤
1.下载ZIP升级文件并解压 2.打开HFS,把解压后的文件夹拖到"Virtual File System"下,在弹出的对话框中点击"Virtual folder&quo ...
- Python/MySQL(四、MySQL数据库操作)
Python/MySQL(四.MySQL数据库操作) 一.数据库条件语句: case when id>9 then ture else false 二.三元运算: if(isnull(xx)0, ...
- POJ-2485 Highways---最小生成树中最大边
题目链接: https://vjudge.net/problem/POJ-2485 题目大意: 求最小生成树中的最大边 思路: 是稠密图,用prim更好,但是规模不大,kruskal也可以过 #inc ...
- MySQL 5.7 基于复制线程SQL_Thread加快恢复的尝试
1. MySQL 数据恢复常用办法 MySQL恢复的方法一般有三种: 1. 官方推荐的基于全备+binlog , 通常做法是先恢复最近一次的全备,然后通过mysqlbiinlog --start-po ...
- 计算机网络-TCP之三次握手/四次握手
.概念 .特点 .背景知识补充 .三次握手 .四次握手 .其他补充 1.概念 TCP(Transmission Control Protocol,传输控制协议)是 在不可靠的IP层之上实现的可靠的数据 ...
- java设计模式之代理设计模式(Proxy)
一个简单Proxy代理模式范例 interface Subject{ //定义核心主题所要完成的功能 public void make(); } class RealSubject implement ...