ETL之apache hop系列2-hop web安装和入门
前言
在Docker安装apache hop 首先确保Docker已经安装和运行Java 11 JDK
安装文档参考:https://blog.csdn.net/Chia_Hung_Yeh/article/details/121060990
一、使用Docker 安装部署
1、拉取镜像
推荐使用下面的web版本
docker pull apache/hop:latest
docker pull apache/hop-web:latest
2、部署
a、简单部署(不使用用户名密码)
docker run -p 8080:8080 apache/hop-web:latest
b、使用用户名密码和相关数据库配置的部署
docker文件映射参考:
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/plugins:/usr/local/tomcat/plugins/ \
-v /home/hop-web/lib:/usr/local/tomcat/lib/ \
apache/hop-web:latest
c、实际部署(使用用户名和密码已经同步数据库)
参考:
https://hop.apache.org/manual/latest/installation-configuration.html
https://hop.apache.org/manual/latest/hop-gui/hop-web.html(主要)
https://hop.apache.org/manual/latest/database/databases/mysql.html(主要)
https://blog.csdn.net/qq_51322266/article/details/125408967
1)在根目录home文件夹下hop-web增加配置文件,配置参考153Linux服务器上的配置
2)运行下面的docker 命令
在home/hop-web文件夹下创建config、logs、plugins三个文件夹(推荐这种)
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/logs:/usr/local/tomcat/logs/ \
-v /home/hop-web/plugins/databases/mysql/lib:/usr/local/tomcat/plugins/databases/mysql/lib/ \
-v /home/hop-web/plugins/databases/mssql/lib:/usr/local/tomcat/plugins/databases/mssql/lib/ \
-v /home/hop-web/plugins/databases/oracle/lib:/usr/local/tomcat/plugins/databases/oracle/lib/ \
apache/hop-web:latest
部署成功后,浏览器打开如:http://192.168.1.153:24001/ui地址填写用户名密码登录
当然可以先创建一个简单部署的临时容器
a、把容器里的文件复制到宿主机上
docker cp c728f91ee95d:/usr/local/tomcat/webapps /home/hop
b、删除该临时容器
docker stop c728f91ee95d
docker rm c728f91ee95d
c、创建一个新的容器并挂载宿主机文件
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/logs:/usr/local/tomcat/logs/ \
-v /home/hop-web/webapps:/usr/local/tomcat/webapps/ \
-v /home/hop-web/plugins/databases/mysql/lib:/usr/local/tomcat/plugins/databases/mysql/lib/ \
-v /home/hop-web/plugins/databases/mssql/lib:/usr/local/tomcat/plugins/databases/mssql/lib/ \
-v /home/hop-web/plugins/databases/oracle/lib:/usr/local/tomcat/plugins/databases/oracle/lib/ \
apache/hop-web:latest
二、使用apache/hop-web
参考文章:
https://www.modb.pro/db/623848
https://blog.csdn.net/ym5209999/article/details/126009271
1、创建项目
官网文档:Projects & Environments :: Apache Hop
1)点击顶部菜单栏的P+按钮,弹出新增项目对话框界面
2)填写对应的项目名称和保存路径等,然后点击OK保存项目,项目路径一般保存在projects文件夹下和default文件夹同级,如下图第二张


2、数据库连接
1)点击左上角“+”号,选择“Relational Database Connection”进入数据库连接界面

2)参照下图输入数据库连接相关信息

3)测试连接及保存当前数据库连接,X按钮会提示保存该数据库连接点击保存

4)保存完成后,在左侧“Relational Database Connection”中,会出现新建的数据库连接信息

3、创建管道-示例
管道控件使用说明文档:Transform Plugins :: Apache Hop
1)选择上面创建的项目名称,点击左上角“+”号,选择“Pipeline”进入新增管道界面

2)在页面空白处点击鼠标左键,弹出对话框选择对应的控件,点击确定

3)在鼠标左键点击控件下方的文字,弹出对话框,在对话框中填写对应的内容,点击保存


4)同步骤2,创建一个新的控件(比如Insert/update),鼠标左键点击前面创建的控件图标,在弹出的对话框中选择Create hop箭头图标,然后再鼠标左键连接后面创建的控件


5)同步骤3,点击后面创建的控件,弹出对话框,在对话框中填写对应的内容,点击保存

6)保存管道文件,保存的文件最好是在该项目文件所在文件路径的子级

7)打开管道文件

8)运行管道文件


4、创建工作流-示例
工作流控件使用说明文档:Untitled :: Apache Hop
1)选择上面创建的项目名称,点击左上角“+”号,选择“Workflow”进入新增管道界面

2)在页面空白处点击鼠标左键,弹出对话框选择Pipelin控件,点击确定

3)鼠标左键点击Pipelin控件下方的文字,在弹出框点击"Browse..."浏览选择管道文件,点击OK

4)同步骤2,选择Success控件

5)控件连接,鼠标左键点击前面创建的控件图标,在弹出的对话框中选择Create hop箭头图标,然后再鼠标左键连接后面创建的控件

6)保存工作流文件

7)运行工作流文件

ETL之apache hop系列2-hop web安装和入门的更多相关文章
- Apache Shiro系列三,概述 —— 10分钟入门
一.介绍 看完这个10分钟入门之后,你就知道如何在你的应用程序中引入和使用Shiro.以后你再在自己的应用程序中使用Shiro,也应该可以在10分钟内搞定. 二.概述 关于Shiro的废话就不多说了 ...
- 【Apache KafKa系列之一】KafKa安装部署
kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能. 高吞吐量:即使是非常普通的 ...
- kubernetes系列(十六) - Helm安装和入门
1. helm简介 1.1 为什么需要helm 1.2 helm中几个概念 1.3 helm用途 2. helm安装 3. helm的基本使用 3.1 安装chart仓库里面的chart 3.2 创建 ...
- Apache Shiro系列之五,概述 —— 配置
Shiro设计的初衷就是可以运行于任何环境:无论是简单的命令行应用程序还是复杂的企业集群应用.由于运行环境的多样性,所以有多种配置机制可用于配置,本节我们将介绍Shiro内核支持的这几种配置机制. ...
- Apache Shiro系列四,概述 —— Shiro的架构
Shiro的设计目标就是让应用程序的安全管理更简单.更直观. 软件系统一般是基于用户故事来做设计.也就是我们会基于一个客户如何与这个软件系统交互来设计用户界面和服务接口.比如,你可能会说:“如 ...
- kubernetes系列(十七) - 通过helm安装dashboard详细教程
1. 前提条件 2. 配置https证书为secret 3. dashboard安装 3.1 helm拉取dashboard的chart 3.2 配置dashboard的chart包配置 3.3 he ...
- nginx高性能WEB服务器系列之一简介及安装
nginx系列友情链接:nginx高性能WEB服务器系列之一简介及安装https://www.cnblogs.com/maxtgood/p/9597596.htmlnginx高性能WEB服务器系列之二 ...
- Apache Kafka监控之Kafka Web Console
Kafka Web Console:是一款开源的系统,源码的地址在https://github.com/claudemamo/kafka-web-console中.Kafka Web Console也 ...
- apache kafka系列之Producer处理逻辑
最近研究producer的负载均衡策略,,,,我在librdkafka里边用代码实现了partition 值的轮询方法,,,但是在现场验证时,他的负载均衡不起作用,,,所以来找找原因: 下文是一篇描 ...
- 【ABAP系列】SAP Web Dynpro 技术简介
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP Web Dynpro 技 ...
随机推荐
- Selenium - 元素定位(1) - 八种元素定位
Selenium - 元素定位 八种元素定位 我们在做WEB自动化时,最根本的就是操作页面上的各种元素,而操作的基础便是元素的定位,只有准确地定位到唯一元素才能进行后续的自动化控制,下面将对各种元素定 ...
- vue全家桶进阶之路37:Vue3 路由守卫
在 Vue.js 3.x 中,我们可以使用路由守卫来拦截路由的跳转,从而实现一些功能,例如:登录验证.页面权限控制等. Vue.js 3.x 中的路由守卫和 Vue.js 2.x 中的基本相同,都包含 ...
- 代码随想录算法训练营Day18 二叉树| 654.最大二叉树 617.合并二叉树 700.二叉搜索树中的搜索 98.验证二叉搜索树
654.最大二叉树 题目链接:654.最大二叉树 给定一个不重复的整数数组 nums . 最大二叉树 可以用下面的算法从 nums 递归地构建: 创建一个根节点,其值为 nums 中的最大值. 递归地 ...
- chrome 应用程序无法启动,因为应用程序的并行配置不正确
win10系统谷歌浏览器无法启动,系统报错,如下图: 解决方案: 步骤1:进入chrome的安装路径C:\Program Files (x86)\Google\Chrome\... ...(找到自己的 ...
- Flutter三棵树系列之BuildOwner
引言 Flutter开发中三棵树的重要性不言而喻,了解其原理有助于我们开发出性能更优的App,此文主要从源码角度介绍Element树的管理类BuildOwner. 是什么? BuildOwner是el ...
- Ado.Net 数据库访问技术(.Net 6版本)
1. ADO.NET的前世今生 ADO.NET的名称起源于ADO(ActiveX Data Objects),是一个COM组件库,用于在以往的Microsoft技术中访问数据.之所以使用ADO.NET ...
- 7-9 《Fibonacci 数列》
7-9 <Fibonacci 数列> 思路:吃过前面<序列求和>问题的亏 但还是要尝试一下循环大法 Fn=Fn-1+Fn-2 定义int型 aFn-1 , bFn-2 , cF ...
- Python潮流周刊#5:并发一百万个任务要用多少内存?
你好,我是猫哥.这里记录每周值得分享的 Python 及通用技术内容,部分为英文,已在小标题注明.(标题取自其中一则分享,不代表全部内容都是该主题,特此声明.) 博客原文:https://python ...
- 如何从零开始构建 API ?
假设你请承包商从零开始建造一座房子,你肯定期望他们交付最高质量的房子.他们必须通过检查.遵守安全规范并遵循项目中约定的要求.因为建房子可容不得走捷径.如果承包商经常走捷径,他们的声誉会受到影响,从而失 ...
- WWDC2023 Session系列:探索XCode15新特性
一.版本说明 XCode 15 beta 发布于 2023 年 6月5日, 可支持 macOS 13.3 或以上版本, 你可以按需下载需要的平台. 二.新增特性 1.代码智能提示 (Code comp ...