爬虫管理平台以及wordpress本地搭建

学习目标:

  1. 各爬虫管理平台了解

    • scrapydweb
    • gerapy
    • crawlab
  2. 各爬虫管理平台的本地搭建
  3. Windows下的wordpress搭建

爬虫管理平台了解:

  1. scrapydweb:

    用于Scrapyd实施管理的web应用程序,支持Scrapy日志分析和可视化
    
    github地址:https://github.com/my8100/scrapydweb.git
  2. gerapy:

    基于Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬虫管理框架
    
    相关的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html
    
    该项目github地址:https://github.com/Gerapy/Gerapy.git
  3. crawlab:

    基于Golang的分布式爬虫管理平台,支持多种编程语言以及多种爬虫框架.
    
    文档地址:https://docs.crawlab.cn/zh/
    
    GitHub地址:https://github.com/crawlab-team/crawlab.git

注意:前两个框架的搭建基于Scrapyd,如果不知道怎么配置可以看我之前写的博客:https://www.cnblogs.com/xbhog/p/13336651.html

爬虫管理平台的本地搭建:

  1. scrapydweb搭建:

    • 安装:pip install scrapydweb -i https://pypi.doubanio.com/simple

    • 先打开scrapyd(命令行输入)

    • 再输入scrapydweb

    • 界面效果:

    • 部署安装网上教程很多,不多赘述

  2. gerapy

  3. crawlab:(配置安装官方给的很详细,这里简单说下)

    • 首先把代码从远程仓库clone下来:git clone 地址/复制地址到pycharm中

    • #官方推荐几种安装方式:
      Docker(入门简单,推荐)
      Kubernetes(多机器部署,推荐)
      直接部署(理解原理)
      开发模式(开发调试)
      多节点部署
      #个人选择docker,该项目配置环境过多,怕给本地造成冲突
    • docker的安装:

Windows下的wordpress搭建:

环境准备:

  1. wampserver软件
  2. wordpress源码
  3. 百度网盘地址:链接:https://pan.baidu.com/s/1mAFu8XrNSfpyL_VgSvb8VA 提取码:1234

搭建步骤:

  1. 打开wampserver.exe,默认安装(注意在安装路径的时候不能有中文文件夹)

  2. 最后会有四个弹窗:

    • 是否更改浏览器,该软件默认浏览器是explorer,我们点击是,选择谷歌浏览器;

    • 选择nodpad++,选择否。

  3. 安装完成后,点击桌面图标运行,程序颜色表示状态

    • 红色:配置没启动
    • 橙色:配置启动一部分
    • 绿色:配置完全启动
  4. 绿色后,单机程序图标,点击localhost进入网页

  5. 将预先准备的wordpress安装包放到wampserver/www文件夹下

  6. 进入网页地址输入:localhost/wordpress

    点击开始进入配置页面:

  7. 上面配置先放置,我们先进行数据库设置

    输入用户名root,密码空,点击执行。

  8. 进入账户下的root,修改权限,修改密码

  9. 我们需要对应之前的数据库名称(wordpress),所以新建数据库

  10. 设置成功后返回之前的数据库登录页面,填写相关信息:

  11. 提交进入登陆界面配置:

  12. 填写完成进入登陆界面

  13. 登陆:前后台界面

爬虫管理平台以及wordpress本地搭建的更多相关文章

  1. 分布式爬虫管理平台Crawlab安装与使用

    Why,为什么需要爬虫管理平台? 以下摘自官方文档: Crawlab主要解决的是大量爬虫管理困难的问题,例如需要监控上百个网站的参杂scrapy和selenium的项目不容易做到同时管理,而且命令行管 ...

  2. Crawlab Lite 正式发布,更轻量的爬虫管理平台

    Crawlab 是一款基于 Golang 的分布式爬虫管理平台,产品发布已经一年有余,经过开发团队的不断打磨,即将迭代到 v0.5 版本.在这期间我们为 Crawlab 加入了大量社区用户共同期望的功 ...

  3. win7下wordPress本地搭建博客详解(深度亲测整理---傻瓜式详细教程)

    搭建一个wordPress作为一个个人博客本来是特别简单的事情,但是网上的各种转载让初学者举步维艰,我就本身条件而言,会java EE,懂mysql都花费了我好长时间才搭建好本地博客. 注意:这个是本 ...

  4. 使用Docker部署爬虫管理平台Crawlab

    当前目录创建 docker-compose.yml 文件 version: '3.3' services: master: image: tikazyq/crawlab:latest containe ...

  5. 30分钟快速搭建Web CRUD的管理平台--django神奇魔法

    加上你的准备的时间,估计30分钟完全够用了,因为最近在做爬虫管理平台,想着快速开发,没想到python web平台下有这么非常方便的框架,简洁而优雅.将自己的一些坑总结出来,方便给大家的使用. 准备环 ...

  6. CCNET+ProGet+Windows Batch搭建全自动的内部包打包和推送及管理平台

    所要用的工具: 1.CCNET(用于检测SVN有改动提交时自动构建,并运行nuget的自动打包和推送批处理) 2.ProGet(目前见到最好用的nuget内部包管理平台) 3.Windows Batc ...

  7. 利用XAMPP本地搭建WordPress博客

    现在越来越多的人利用WordPress搭建了自己的博客网站,我也是一样,但是还有一些人不知道怎么搭建WordPress网站的方法,因为怕弄 不好,所以也就没有花钱去做,所以这里我就讲讲怎么样利用XAM ...

  8. Hudson持续集成管理平台搭建

    IP: 10.0.70.106  8G 内存 (Hudson 多 个 工程 在 同 时 构建 的情况下 比 较耗内存) 环 境: CentOS 6.5 . JDK7 注:Hudson 只是一个持续集成 ...

  9. 利用Wamp在本地搭建一个wordpress站点

    原文链接:利用Wamp在本地搭建一个wordpress站点 有时候我们会想搭建一个自己的站点,可是由于只是想自己访问,就不是很想为这个站点在买一个服务器和域名,那我们可能首先就想到把自己电脑当做服务器 ...

随机推荐

  1. 初探RabbitMQ消息队列

    SpringBoot 是为了简化 Spring 应用的创建.运行.调试.部署等一系列问题而诞生的产物,自动装配的特性让我们可以更好的关注业务本身而不是外部的XML配置,我们只需遵循规范,引入相关的依赖 ...

  2. 告别传统机房:3D 机房数据可视化实现智能化与VR技术的新碰撞

    前言 随着各行业对计算机依赖性的日益提高,计算机信息系统的发展使得作为其网络设备.主机服务器.数据存储设备.网络安全设备等核心设备存放地的计算机机房日益显现出它的重要地位,而机房的环境和动力设备如供配 ...

  3. 优化:在k8s上部署的gitlab

    gitlab组件图 gitlab在k8s上占用资源 # kubectl top pods -n default | grep git* gitlab-gitaly-0 9m 444Mi gitlab- ...

  4. 使用现代CSS的响应式版面

    为一个网站选择类型尺寸是项艰巨的任务. 标题和段落的尺寸在网页布局和可读性方面处理起来很棘手. 谢天谢地, 我们有模块化缩放可以引导我们. 模块化缩放是一个数字序列以某种方式关联另一个序列. Tim ...

  5. 从零开始学Electron笔记(二)

    在之前的文章我们简单介绍了一下Electron可以用WEB语言开发桌面级应用,接下来我们继续说一下Electron的菜单创建和事件绑定. 我们接上一章的代码继续编写,上一章代码 https://www ...

  6. 电商项目app开发

    购物app的开发 首先我们本次要写的是一个电商的项目,项目主要功能有登录.注册.商品展示.轮播图.加入购物车.购物车管理.支付管理.地址管理.个人信息的修改.商品的分类展示.微信支付等等.主要使用vu ...

  7. 1-The next outbreak we're not ready

    When I was a kid, the disaster we worried about most was a nuclear war. [wen aɪ wəz ə kɪd]

  8. 手把手整合SSM框架

    前言 如果看过前几篇文章,对 Spring 和 MyBatis 有了一定了解,一定想上手试试.这篇文章从 0 到 1,手把手整合 SSM (Spring.Spring MVC.MyBatis). 本篇 ...

  9. Python 实现邮件发送功能(初级)

    在我们日常项目中,会经常使用到邮件的发送功能,如何利用Python发送邮件也是一项必备的技能.本文主要讲述利用Python来发送邮件的一些基本操作. 本章主要包含知识点: 邮件发送原理简述即常用smt ...

  10. Istio安全-认证(istio 系列七)

    Istio安全-认证 目录 Istio安全-认证 认证策略 配置 自动mutual TLS 全局启用istio的mutual TLS STRIC模式 卸载 针对单个命名空间或负载启用mutual TL ...