ETL之apache hop系列2-hop web安装和入门
前言
在Docker安装apache hop 首先确保Docker已经安装和运行Java 11 JDK
安装文档参考:https://blog.csdn.net/Chia_Hung_Yeh/article/details/121060990
一、使用Docker 安装部署
1、拉取镜像
推荐使用下面的web版本
docker pull apache/hop:latest
docker pull apache/hop-web:latest
2、部署
a、简单部署(不使用用户名密码)
docker run -p 8080:8080 apache/hop-web:latest
b、使用用户名密码和相关数据库配置的部署
docker文件映射参考:
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/plugins:/usr/local/tomcat/plugins/ \
-v /home/hop-web/lib:/usr/local/tomcat/lib/ \
apache/hop-web:latest
c、实际部署(使用用户名和密码已经同步数据库)
参考:
https://hop.apache.org/manual/latest/installation-configuration.html
https://hop.apache.org/manual/latest/hop-gui/hop-web.html(主要)
https://hop.apache.org/manual/latest/database/databases/mysql.html(主要)
https://blog.csdn.net/qq_51322266/article/details/125408967
1)在根目录home文件夹下hop-web增加配置文件,配置参考153Linux服务器上的配置
2)运行下面的docker 命令
在home/hop-web文件夹下创建config、logs、plugins三个文件夹(推荐这种)
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/logs:/usr/local/tomcat/logs/ \
-v /home/hop-web/plugins/databases/mysql/lib:/usr/local/tomcat/plugins/databases/mysql/lib/ \
-v /home/hop-web/plugins/databases/mssql/lib:/usr/local/tomcat/plugins/databases/mssql/lib/ \
-v /home/hop-web/plugins/databases/oracle/lib:/usr/local/tomcat/plugins/databases/oracle/lib/ \
apache/hop-web:latest
部署成功后,浏览器打开如:http://192.168.1.153:24001/ui地址填写用户名密码登录
当然可以先创建一个简单部署的临时容器
a、把容器里的文件复制到宿主机上
docker cp c728f91ee95d:/usr/local/tomcat/webapps /home/hop
b、删除该临时容器
docker stop c728f91ee95d
docker rm c728f91ee95d
c、创建一个新的容器并挂载宿主机文件
docker run -it -p 24001:8080 \
-v /home/hop-web/config:/config/ \
-v /home/hop-web/logs:/usr/local/tomcat/logs/ \
-v /home/hop-web/webapps:/usr/local/tomcat/webapps/ \
-v /home/hop-web/plugins/databases/mysql/lib:/usr/local/tomcat/plugins/databases/mysql/lib/ \
-v /home/hop-web/plugins/databases/mssql/lib:/usr/local/tomcat/plugins/databases/mssql/lib/ \
-v /home/hop-web/plugins/databases/oracle/lib:/usr/local/tomcat/plugins/databases/oracle/lib/ \
apache/hop-web:latest
二、使用apache/hop-web
参考文章:
https://www.modb.pro/db/623848
https://blog.csdn.net/ym5209999/article/details/126009271
1、创建项目
官网文档:Projects & Environments :: Apache Hop
1)点击顶部菜单栏的P+按钮,弹出新增项目对话框界面
2)填写对应的项目名称和保存路径等,然后点击OK保存项目,项目路径一般保存在projects文件夹下和default文件夹同级,如下图第二张


2、数据库连接
1)点击左上角“+”号,选择“Relational Database Connection”进入数据库连接界面

2)参照下图输入数据库连接相关信息

3)测试连接及保存当前数据库连接,X按钮会提示保存该数据库连接点击保存

4)保存完成后,在左侧“Relational Database Connection”中,会出现新建的数据库连接信息

3、创建管道-示例
管道控件使用说明文档:Transform Plugins :: Apache Hop
1)选择上面创建的项目名称,点击左上角“+”号,选择“Pipeline”进入新增管道界面

2)在页面空白处点击鼠标左键,弹出对话框选择对应的控件,点击确定

3)在鼠标左键点击控件下方的文字,弹出对话框,在对话框中填写对应的内容,点击保存


4)同步骤2,创建一个新的控件(比如Insert/update),鼠标左键点击前面创建的控件图标,在弹出的对话框中选择Create hop箭头图标,然后再鼠标左键连接后面创建的控件


5)同步骤3,点击后面创建的控件,弹出对话框,在对话框中填写对应的内容,点击保存

6)保存管道文件,保存的文件最好是在该项目文件所在文件路径的子级

7)打开管道文件

8)运行管道文件


4、创建工作流-示例
工作流控件使用说明文档:Untitled :: Apache Hop
1)选择上面创建的项目名称,点击左上角“+”号,选择“Workflow”进入新增管道界面

2)在页面空白处点击鼠标左键,弹出对话框选择Pipelin控件,点击确定

3)鼠标左键点击Pipelin控件下方的文字,在弹出框点击"Browse..."浏览选择管道文件,点击OK

4)同步骤2,选择Success控件

5)控件连接,鼠标左键点击前面创建的控件图标,在弹出的对话框中选择Create hop箭头图标,然后再鼠标左键连接后面创建的控件

6)保存工作流文件

7)运行工作流文件

ETL之apache hop系列2-hop web安装和入门的更多相关文章
- Apache Shiro系列三,概述 —— 10分钟入门
一.介绍 看完这个10分钟入门之后,你就知道如何在你的应用程序中引入和使用Shiro.以后你再在自己的应用程序中使用Shiro,也应该可以在10分钟内搞定. 二.概述 关于Shiro的废话就不多说了 ...
- 【Apache KafKa系列之一】KafKa安装部署
kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能. 高吞吐量:即使是非常普通的 ...
- kubernetes系列(十六) - Helm安装和入门
1. helm简介 1.1 为什么需要helm 1.2 helm中几个概念 1.3 helm用途 2. helm安装 3. helm的基本使用 3.1 安装chart仓库里面的chart 3.2 创建 ...
- Apache Shiro系列之五,概述 —— 配置
Shiro设计的初衷就是可以运行于任何环境:无论是简单的命令行应用程序还是复杂的企业集群应用.由于运行环境的多样性,所以有多种配置机制可用于配置,本节我们将介绍Shiro内核支持的这几种配置机制. ...
- Apache Shiro系列四,概述 —— Shiro的架构
Shiro的设计目标就是让应用程序的安全管理更简单.更直观. 软件系统一般是基于用户故事来做设计.也就是我们会基于一个客户如何与这个软件系统交互来设计用户界面和服务接口.比如,你可能会说:“如 ...
- kubernetes系列(十七) - 通过helm安装dashboard详细教程
1. 前提条件 2. 配置https证书为secret 3. dashboard安装 3.1 helm拉取dashboard的chart 3.2 配置dashboard的chart包配置 3.3 he ...
- nginx高性能WEB服务器系列之一简介及安装
nginx系列友情链接:nginx高性能WEB服务器系列之一简介及安装https://www.cnblogs.com/maxtgood/p/9597596.htmlnginx高性能WEB服务器系列之二 ...
- Apache Kafka监控之Kafka Web Console
Kafka Web Console:是一款开源的系统,源码的地址在https://github.com/claudemamo/kafka-web-console中.Kafka Web Console也 ...
- apache kafka系列之Producer处理逻辑
最近研究producer的负载均衡策略,,,,我在librdkafka里边用代码实现了partition 值的轮询方法,,,但是在现场验证时,他的负载均衡不起作用,,,所以来找找原因: 下文是一篇描 ...
- 【ABAP系列】SAP Web Dynpro 技术简介
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP Web Dynpro 技 ...
随机推荐
- Selenium - 元素定位(3) - CSS进阶
Selenium - 元素定位 CSS 定位进阶 元素示例 属性定位 # css 通过id属性定位 driver.find_element_by_css_selector("#kw" ...
- dotnet平台Http消息处理者工厂
1 前言 Microsoft.Extensions.Http是一个设计非常优异的客户端工厂库,其提供了IHttpClientFactory用于创建HttpClient和IHttpMessageHand ...
- 如何使用C++ 在Word文档中创建列表
列表分类是指在Word文档中使用不同格式排序的列表,来帮助我们一目了然地表达出一段文字的主要内容.比如,当我们描述了某个主题的若干点,就可以用列表把它们一一表达出来,而不是写成完整的段落形式.同时,列 ...
- pyinstaller打包exe
1.执行环境说明 python版本3.7直接使用pip进行安装pywin32.pyinstallerpip install pywin32pip install pyinstaller 2.使用了第三 ...
- Helm实战案例二:在Kubernetes(k8s)上使用helm安装部署日志管理系统EFK
目录 一.系统环境 二.前言 三.日志管理系统EFK简介 四.helm安装EFK 4.1 helm在线安装EFK 4.2 helm离线安装EFK(推荐) 五.访问kibana 5.1 数据分片 六.卸 ...
- 如何在Databricks中使用Spark进行数据处理与分析
目录 <如何在Databricks中使用Spark进行数据处理与分析> 随着大数据时代的到来,数据处理与分析变得越来越重要.在数据处理与分析过程中,数据的存储.处理.分析和展示是不可或缺的 ...
- 如何扩展及优化CI/CD流水线?
如今应用程序的开发通常由多个开发人员组成的团队完成.每个人或团队在项目中发挥自己的作用,然后我们发现在项目的末尾总是有几段代码需要编译,根据每个人的工作方法,管理这种集成可能会浪费很多时间.持续集成和 ...
- 代理详解(java代理和CGLIB动态代理)
[代理]大家都知道,特别是在spring中aop.spring中的事务.spring解析注解@Configuration,以及最原始的解析spring.xml的配置,这些都是使用代理来进行实现的, ...
- Linux系统运维之zabbix配置tomcat监控
一.介绍 半年前安装的zabbix监控,当时配合异地的测试人员给A项目做压力测试,主要监控项目部署的几台服务器的内存.CPU信息,以及后来网络I/O等,也没考虑JVM:最近闲下来,想完善下监控,故留此 ...
- Ubuntu系统字体命令和字体的安装
本人使用的是Windows 10下的WSL,Linux版本是Ubuntu18.04,系统原始是没有安装任何字体的,mkfontscale.mkfontdir和fc-cache命令也是不存在的,直接运行 ...