scrapyd使用教程

1. 安装服务器：

pip install scrapyd

启动： scrapyd

访问：127.0.0.1:6800

2. 安装客户端

pip install scrapyd-client

3. 进入爬虫项目根目录：找到

scrapy.cfg 文件修改如下

[settings]

default = blog.settings

[deploy:zwb]

url = http://localhost:6800/

project = blog

4. 发布项目

scrapyd-deploy target -p prject

这里target 为你的服务器命令，prject是你项目的名字，发布项目之前我们的scrapyd.cfg必须修改，上面我们已经修改过了，

因此我的命令是：scrapyd-deploy zwb -p blog

scrapyd-deploy <target> -p <project> --version <version>

4.2 启动爬虫

curl http://localhost:6800/schedule.json -d project=blog -d spider=demo

4.3 停止爬虫

curl http://localhost:6800/cancel.json -d project=blog -d job=demo

blog：你爬虫项目的名字，demo：你爬虫的名字

参考文档：https://www.jianshu.com/p/f0077adb74bb

https://www.jianshu.com/p/f815f91949f2

scrapyd使用教程的更多相关文章

scrapyd和scrapyd-client使用教程
原文地址:http://blog.wiseturtles.com/posts/scrapyd.html Tags scrapyd scrapy scrapyd-client By crazygit O ...
Scrapy 爬虫使用指南完全教程
scrapy note command 全局命令: startproject :在 project_name 文件夹下创建一个名为 project_name 的Scrapy项目. scrapy sta ...
第三百七十二节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目
第三百七十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目 scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目下载地址:h ...
Scrapyd发布爬虫的工具
Scrapyd Scrapyd是部署和运行Scrapy.spider的应用程序.它使您能够使用JSON API部署(上传)您的项目并控制其spider. Scrapyd-client Scrapyd- ...
基于scrapyd爬虫发布总结
一.版本情况 python以丰富的三方类库取得了众多程序员的认可,但也因此带来了众多的类库版本问题,本文总结的内容是基于最新的类库版本. 1.scrapy版本:1.1.0 D:\python\Spid ...
五十一 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目
scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目下载地址:https://github.com/scrapy/scrapyd 建议安装 pip3 install s ...
手把手教你如何利用 HeroKu 免费获取一个 Scrapyd 集群
手把手教你如何利用 HeroKu 免费获取一个 Scrapyd 集群本文原始地址:https://sitoi.cn/posts/48724.html 准备环境一个 GitHub 的账号一个 He ...
Scrapy 教程(二)-操作流程
scrapy 是个爬虫框架,是由python编写的,用法类似 django 框架. 创建工程在开始爬虫之前,先创建工程 scrapy startproject projectname 目录结构如下图 ...
【python3】基于scrapyd + scrapydweb 的可视化部署
一.部署组件概览该部署方式适用于 scrapy项目.scrapy-redis的分布式爬虫项目需要安装的组件有: 1.scrapyd 服务端 [运行打包后的爬虫代码](所有的爬虫机器都要安 ...

随机推荐

node版本如何升级
爬坑后的结论:window系统升级node只能到node官网下载window安装包来覆盖之前的node. 以下为我的爬坑之路: 今天安装了vue cli 3,使用命令时报: You are using ...
HearthBuddy的狂野和休闲模式来回切换
表现1 配置是标准,休闲模式然后一直重复提示 select desire deck select causal mode 表现2 配置是狂野,休闲模式然后一直提示切换到狂野切换到标准把模式切 ...
mysql密码忘记更改
忘记mysql的密码是一件不好的事,通常我们会把密码记住,或者是存在文档中,避免忘记,如果忘记了密码可以参照下方方法来更改,这个操作需要重启mysql. 首先我们在my.cnf文件中的[mysqld] ...
ipv4 ipv6 求字符串和整数一一映射的算法 AmazonOrderId
字符串和整数一一映射的算法公司每人的英文名不同,现在给每个英文名一个不同的数字编号,怎么设计? 走ipv4/6 2/32 2/128就够了,把“网段”概念对应到“表或库”,ip有a_e5类,这概念 ...
Systemd 指令
Systemd 指令原文:http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-commands.html 一.由来历史上,Linux 的 ...
linux常用命令(9)nl命令
nl命令在linux系统中用来计算文件中行号.nl 可以将输出的文件内容自动的加上行号!其默认的结果与 cat -n 有点不太一样, nl 可以将行号做比较多的显示设计,包括位数与是否自动补齐 0 等 ...
delphi怎么一次性动态删除（释放）数个动态创建的组件？
比如procedure TForm1.Button1Click(Sender: TObject);vari:Integer;lbl: TLabel;beginfor i:=1 to 3 dobegin ...
C# Timespan Tostring 时分秒格式
timeSpan.ToString(@"hh\:mm\:ss");
HNU_团队项目_数据库框架Mybatis_环境配置和样例
前言数据库从最传统的JDBC连接方式和数据库池化技术到Hibernate的使用,再到Mybatis的快捷轻量级操作,技术迭代的速度飞快. 在了解了基础的理论和方法后,学习前沿编程框架.工具,我认为是 ...
Django-ORM之聚合和分组查询、F和Q查询、事务
聚合查询聚合对查询的结果进行一步的计算加工. aggregate()是QuerySet 的一个终止子句 ,他的作用是,返回一个包含一些键值对的字典.键的名称是聚合值的标识符,值是计算出来的聚合值.键 ...

scrapyd使用教程

scrapyd使用教程的更多相关文章

随机推荐

热门专题