爬虫管理平台以及wordpress本地搭建
爬虫管理平台以及wordpress本地搭建
学习目标:
- 各爬虫管理平台了解
- scrapydweb
- gerapy
- crawlab
- 各爬虫管理平台的本地搭建
- Windows下的wordpress搭建
爬虫管理平台了解:
scrapydweb:
用于Scrapyd实施管理的web应用程序,支持Scrapy日志分析和可视化 github地址:https://github.com/my8100/scrapydweb.git
gerapy:
基于Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬虫管理框架 相关的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html 该项目github地址:https://github.com/Gerapy/Gerapy.git
crawlab:
基于Golang的分布式爬虫管理平台,支持多种编程语言以及多种爬虫框架. 文档地址:https://docs.crawlab.cn/zh/ GitHub地址:https://github.com/crawlab-team/crawlab.git
注意:前两个框架的搭建基于Scrapyd,如果不知道怎么配置可以看我之前写的博客:https://www.cnblogs.com/xbhog/p/13336651.html
爬虫管理平台的本地搭建:
scrapydweb搭建:
安装:pip install scrapydweb -i https://pypi.doubanio.com/simple
先打开scrapyd(命令行输入)
再输入scrapydweb
界面效果:

部署安装网上教程很多,不多赘述
gerapy
- 相关的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html
crawlab:(配置安装官方给的很详细,这里简单说下)
首先把代码从远程仓库clone下来:git clone 地址/复制地址到pycharm中
#官方推荐几种安装方式:
Docker(入门简单,推荐)
Kubernetes(多机器部署,推荐)
直接部署(理解原理)
开发模式(开发调试)
多节点部署
#个人选择docker,该项目配置环境过多,怕给本地造成冲突
docker的安装:
安装环境:本地虚拟化以及hyper-V需要打开,如图所示


默认安装即可
相关详细链接(菜鸟教程:https://www.runoob.com/docker/windows-docker-install.html)
安装docker-compose包:pip install docker-compose
在根目录下测试:
docker-compose ps
正常为空
Name Command State Ports
------------------------------
--------------------------------
安装并启动:docker-compose up -d
Windows下的wordpress搭建:
环境准备:
- wampserver软件
- wordpress源码
- 百度网盘地址:链接:https://pan.baidu.com/s/1mAFu8XrNSfpyL_VgSvb8VA 提取码:1234
搭建步骤:
打开wampserver.exe,默认安装(注意在安装路径的时候不能有中文文件夹)
最后会有四个弹窗:
是否更改浏览器,该软件默认浏览器是explorer,我们点击是,选择谷歌浏览器;

选择nodpad++,选择否。

安装完成后,点击桌面图标运行,程序颜色表示状态
- 红色:配置没启动
- 橙色:配置启动一部分
- 绿色:配置完全启动
绿色后,单机程序图标,点击localhost进入网页
将预先准备的wordpress安装包放到wampserver/www文件夹下

进入网页地址输入:localhost/wordpress

点击开始进入配置页面:

上面配置先放置,我们先进行数据库设置


输入用户名root,密码空,点击执行。
进入账户下的root,修改权限,修改密码


我们需要对应之前的数据库名称(wordpress),所以新建数据库

设置成功后返回之前的数据库登录页面,填写相关信息:

提交进入登陆界面配置:

填写完成进入登陆界面

登陆:前后台界面


爬虫管理平台以及wordpress本地搭建的更多相关文章
- 分布式爬虫管理平台Crawlab安装与使用
Why,为什么需要爬虫管理平台? 以下摘自官方文档: Crawlab主要解决的是大量爬虫管理困难的问题,例如需要监控上百个网站的参杂scrapy和selenium的项目不容易做到同时管理,而且命令行管 ...
- Crawlab Lite 正式发布,更轻量的爬虫管理平台
Crawlab 是一款基于 Golang 的分布式爬虫管理平台,产品发布已经一年有余,经过开发团队的不断打磨,即将迭代到 v0.5 版本.在这期间我们为 Crawlab 加入了大量社区用户共同期望的功 ...
- win7下wordPress本地搭建博客详解(深度亲测整理---傻瓜式详细教程)
搭建一个wordPress作为一个个人博客本来是特别简单的事情,但是网上的各种转载让初学者举步维艰,我就本身条件而言,会java EE,懂mysql都花费了我好长时间才搭建好本地博客. 注意:这个是本 ...
- 使用Docker部署爬虫管理平台Crawlab
当前目录创建 docker-compose.yml 文件 version: '3.3' services: master: image: tikazyq/crawlab:latest containe ...
- 30分钟快速搭建Web CRUD的管理平台--django神奇魔法
加上你的准备的时间,估计30分钟完全够用了,因为最近在做爬虫管理平台,想着快速开发,没想到python web平台下有这么非常方便的框架,简洁而优雅.将自己的一些坑总结出来,方便给大家的使用. 准备环 ...
- CCNET+ProGet+Windows Batch搭建全自动的内部包打包和推送及管理平台
所要用的工具: 1.CCNET(用于检测SVN有改动提交时自动构建,并运行nuget的自动打包和推送批处理) 2.ProGet(目前见到最好用的nuget内部包管理平台) 3.Windows Batc ...
- 利用XAMPP本地搭建WordPress博客
现在越来越多的人利用WordPress搭建了自己的博客网站,我也是一样,但是还有一些人不知道怎么搭建WordPress网站的方法,因为怕弄 不好,所以也就没有花钱去做,所以这里我就讲讲怎么样利用XAM ...
- Hudson持续集成管理平台搭建
IP: 10.0.70.106 8G 内存 (Hudson 多 个 工程 在 同 时 构建 的情况下 比 较耗内存) 环 境: CentOS 6.5 . JDK7 注:Hudson 只是一个持续集成 ...
- 利用Wamp在本地搭建一个wordpress站点
原文链接:利用Wamp在本地搭建一个wordpress站点 有时候我们会想搭建一个自己的站点,可是由于只是想自己访问,就不是很想为这个站点在买一个服务器和域名,那我们可能首先就想到把自己电脑当做服务器 ...
随机推荐
- HDU 2236 无题II 题解
题目 这是一个简单的游戏,在一个n*n的矩阵中,找n个数使得这n个数都在不同的行和列里并且要求这n个数中的最大值和最小值的差值最小. 输入格式 输入一个整数\(T\)表示\(T\)组数据. 对于每组数 ...
- Xor_Sum 题解
题目 You are given a positive integer \(N(1≦N≦10^{18})\). Find the number of the pairs of integers \(u ...
- 状压DP之愤怒的小鸟
题目 传送们P2831 题目较长,不加以赘述 直接步入正题 首先是数学知识,我们可以先根据给出的任意两只猪构建相应的抛物线,同时再构建完之后应判断抛物线的合法性(比如a小于0啊,等等),公式推演就不在 ...
- Spring-boot 启动报错 调试小技巧
描述: 我们在启动spring-boot,spring-cloud 项目时,是不是经常 遇到报错,但是在控制台 没有能找到 具体 报错信息,只是 提示,启动失败,缺乏具体的报错信息,这样就很不方便我们 ...
- 解决nginx 出现 413:Request Entity Too Large
去网上搜了一下,说是上传文件大小超过nginx的限制大小(nginx据说默认只能上传不超过2MB的文件) 解决方法: #nginx/conf/nginx.conf http { ... client_ ...
- MCMC随机采样
1 MCMC蒙特卡罗方法 作为一种随机采样方法,马尔科夫链蒙特卡罗(Markov Chain Monte Carlo,以下简称MCMC)在机器学习,深度学习以及自然语言处理等领域都有广泛的应用,是很多 ...
- SQLAlchemy(四):SQLAlchemy查询高级
目录 SQLAlchemy04 /SQLAlchemy查询高级 1.排序 2.limit.offset和切片操作 3.懒加载 4.group_by 5.having 6.join 7.subquery ...
- pytest框架的安装与使用
pytest框架的安装与使用 一,pytest了解 pytest是python的一种单元测试框架,与python自带的unittest测试框架类似,但是比unittest框架使用起来更简洁,效率更高. ...
- Ethical Hacking - Web Penetration Testing(12)
XSS VULNS XSS - CROSS SITE SCRIPTING VULNS Allow an attacker to inject javascript code into the page ...
- javascript : 对象取值练习
let obj = { "qqq":0, "www":0, "eee":0, "rrr":1, "ttt&qu ...

