django--中运行scrapy框架

1.新建一个django项目，

2.前端展示一个按钮

<form action="/start/" method="POST">

        {% csrf_token %}

        <input type="submit" value="启动爬虫">

</form>

3.在django项目的根目录创建scrapy项目

4.cmd命令行运行：scrapyd 启动服务

5.将scrapy项目部署到当前工程：scrapyd-deploy 爬虫名称 -p 项目名称

6.views.py

# 首页

def index(request):

    return render(request,'index.html',locals())

def start(request):

    if request.method == 'POST':

        # 启动爬虫

        url = 'http://localhost:6800/schedule.json'

        data = {'project': 'ABCkg', 'spider': 'abckg'}

        print(requests.post(url=url, data=data))

        return JsonResponse({'result':'ok'})

7.在本地6800端口点击jobs当前爬虫项目就在运行了。

8.写一个按钮，点击停止scrapy爬虫

def stop(request):

    if request.method == 'POST':

        # 停止爬虫

        url = 'http://127.0.0.1:6800/cancel.json'

        data={"project":'ABCkg','job':'b7fe64ee7ad711e9b711005056c00008'}

        print(requests.post(url=url, data=data))

        return JsonResponse({'result':'stop'})

总结：

----------------scrapyd 管理----------------------
1、获取状态

http://127.0.0.1:6800/daemonstatus.json

2、获取项目列表

http://127.0.0.1:6800/listprojects.json

3、获取项目下已发布的爬虫列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、获取项目下已发布的爬虫版本列表
http://127.0.0.1:6800/listversions.json?project=myproject

5、获取爬虫运行状态

http://127.0.0.1:6800/listjobs.json?project=myproject

6、启动服务器上某一爬虫（必须是已发布到服务器的爬虫)
http://localhost:6800/schedule.json
(post方式，data={"project":myproject,"spider":myspider}）

7、删除某一版本爬虫

http://127.0.0.1:6800/delversion.json -d project=项目名 -d versions
(post方式，data={"project":myproject,"version":myversion}）

8、删除某一工程，包括该工程下的各版本爬虫

http://127.0.0.1:6800/delproject.json
(post方式，data={"project":myproject}）

9、取消爬虫
http://127.0.0.1:6800/cancel.json
(post方式，data={"project":myproject,'job':myjob}）

PS：网络一直不好，几张比较直观的截图粘不上来，如遇不懂，可以参考我的上一篇博客

django--中运行scrapy框架的更多相关文章

Django中的ORM框架使用小技巧
Django中的ORM框架使用小技巧作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. Django对各个数据提供了很好的支持,包括PostgreSQL,MySQL,SQLite ...
Django中使用bookstarp框架（4）
Django中使用bookstarp框架(4) 注意:要使用bookstarp框架前,要先有css的基础因为主要是研究后台的使用方法,就引入前端的框架,简化html上的耗时(主要是不想把时间浪费在前 ...
在Django中运行ExtJS 事例
网上关于ExtJS的事例挺多的,但是在Django中使用ExtJS挺少的,当然了,一些大牛觉得ExtJS运用在页面上是很简单的事,但是对于菜鸟来说,实在有点困难. 我这个例子是用在了sublime3这 ...
在Pycharm中运行Scrapy爬虫项目的基本操作
目标在Win7上建立一个Scrapy爬虫项目,以及对其进行基本操作.运行环境:电脑上已经安装了python(环境变量path已经设置好), 以及scrapy模块,IDE为Pycharm .操作如下: ...
django中运行定时任务脚本
需要使用到django_apscheduler模块,因此先安装: pip install django-apscheduler 然后在工程的settings.py文件中的INSTALLED_APPS模 ...
在Django中运行脚本文件以及打印出SQL语句。
Django终端打印SQL语句在Django项目的settings.py文件中,在最后复制粘贴如下代码: LOGGING = { 'version': 1, 'disable_existing_lo ...
Django中的DRF框架视图集使用
1. 两个基类 1)APIView Django REST_framework 中所有视图的基类是APIView 父类是View 支持定义的属性: authentication_classes 列 ...
Scrapy框架
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中.其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以 ...
基于scrapy框架的爬虫
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. scrapy 框架高性能的网络请求高性能的数据解析高性能的 ...

随机推荐

知识图谱基础之RDF，RDFS与OWL 2
https://zhuanlan.zhihu.com/p/32122644 看过之前两篇文章([1](为什么需要知识图谱?什么是知识图谱?——KG的前世今生), [2](语义网络,语义网,链接数据和知 ...
Dockerfile编写
Dockerfile 是一个文本文件,其内包含了一条条的指令,每一条指令构建一层,因此每一条指令的内容,就是描述该层应当如何构建编写命令: 1.FROM作用:声明使用哪个基础镜像格式:FROM IMA ...
MSSQL一个关于Count函数的小实例
--创建测试表 if object_id(N'T_Test',N'U') is null CREATE TABLE [dbo].[T_Test] ( , ) PRIMARY key NOT NULL, ...
将CocoStudio产生的UI文件导入到项目
配置: Xcode 6.0 + CocoStudio 1.6 + Cocos2d-x 3.4 添加资源将导出的资源文件放到 Resource 文件夹下. 头文件 #include "coc ...
ETCD:运行时重新配置设计
原文地址:the runtime configuration design 运行时重新配置是分布式系统中最难,最容易出错的部分,尤其是在基于共识(像etcd)的系统中. 阅读并学习关于etcd的运行时 ...
SpringCloud微服务(04)：Turbine组件，实现微服务集群监控
本文源码:GitHub·点这里 || GitEE·点这里写在前面,阅读本文前,你需要了解熔断器相关内容 SpringCloud微服务:Hystrix组件,实现服务熔断一.聚合监控简介 1.Dash ...
实现用SQL查询连续发文天数/连续登录天数
当月最长连续发文天数: //临时:id_time_table: select distinct app_id, from_unixtime(create_date_time, 'yyyy-MM-dd' ...
【SDOI 2015】约数个数和
Problem Description 设 \(d(x)\) 为 \(x\) 的约数个数,给定 \(N\).\(M\),求 \[ \sum_{i=1}^N \sum_{j=1}^M d(ij) \] ...
C++ float vs double
精度相比 float ,double 从其名字上已经展示出,它的精度是前者的两倍,他们的精度分别为: float: 7 位数字 double: 15 位数字可通过如下的示例看出,在重复进行计算时, ...
spring常用注解整理
参看大佬博客https://www.cnblogs.com/xiaoxi/p/5935009.html

django--中运行scrapy框架

django--中运行scrapy框架的更多相关文章

随机推荐

热门专题