同步工具-Oceanus打通mysql到Iceberg

一、服务配置

已配置好gt_oneline_2，其它集群还需按照下面方式特殊配置

1、需要腾讯Oceanus同学在后端修改高途flink集群配置core-site.xml文件，增加如下配置。只能绑定一个chdfs环境，这边绑定的测试环境，线上环境需要改qcloud.object.storage.zk.address

<property>

    <name>fs.AbstractFileSystem.ofs.impl</name>

    <value>com.qcloud.chdfs.fs.CHDFSDelegateFSAdapter</value>

</property>

<property>

    <name>fs.ofs.impl</name>

    <value>com.qcloud.chdfs.fs.CHDFSHadoopFileSystemAdapter</value>

</property>

<property>

    <name>fs.ofs.tmp.cache.dir</name>

    <value>/tmp/chdfs/</value>

</property>

<property>

    <name>fs.ofs.user.appid</name>

    <value>1234</value>

</property>

<property>

    <name>fs.ofs.bucket.region</name>

    <value>ap-beijing</value>

</property>

2、chdfs产品挂载点调整

测试环境挂载点：gaotu-chdfs-test

挂载地址：chdfs产品查看地址

权限组增加Oceanus的信息，Oceanus伙伴提供vpc信息，chdfs伙伴王帅后端添加。

如：VpcId: 无权限 | 权限组Id: ag-1234

二、任务配置

可参考test_iceberg_2的V7版本，最精简

1、登录hadoop集群hive metastore节点，如测试环境127，获取以下配置文件

（1）krb认证文件：bdg_app.keytab

路径：/root/add_princals/certificate

（2）krb配置文件：krb5.conf

路径：/etc/krb5.conf

（3）hdfs配置：core-site.xml

路径：/usr/local/service/hadoop/etc/hadoop/core-site.xml

（4）hdfs配置：hdfs-site.xml

路径：/usr/local/service/hadoop/etc/hadoop/hdfs-site.xml

（5）hive配置：hive-site.xml

路径：/usr/local/service/hive/conf/hive-site.xml

（6）空配置：hivemetastore-site.xml

下载地址：https://cloud.tencent.com/document/product/849/55238

（6）空配置：hiveserver2-site.xml

下载地址同上：https://cloud.tencent.com/document/product/849/55238

2、配置文件打包到一起

jar cvf hdfs-bdg_app.jar krb5.conf bdg_app.keytab core-site.xml hdfs-site.xml hive-site.xml hivemetastore-site.xml hiveserver2-site.xml

3、特殊依赖jar下载

地址：https://cloud.tencent.com/document/product/849/53852

文件：flink-chdfs-hadoop-1.10.0-0.1.4.jar（改良后仅这一个文件即可，下图可忽略）

4、Oceanus依赖管理上传依赖信息（改良后就两个文件即可，测试阶段是四个）

flink-chdfs-hadoop-1.10.0-0.1.4.jar (V1)，hdfs-bdg_app.jar (V2)

5、任务配置上面四个依赖，以及高级参数。线上需要替换值

pipeline.max-parallelism: 2048

security.kerberos.login.principal: bdg_app@EMR

security.kerberos.login.keytab: bdg_app.keytab

security.kerberos.login.conf: krb5.conf

containerized.taskmanager.env.HADOOP_USER_NAME: bdg_app

containerized.master.env.HADOOP_USER_NAME: bdg_app

6、任务配置信息

CREATE TABLE `test_mysql_metrices` (

  id                            bigint

  ,metric_id                    STRING

  ,`version`                    int

  ,name_en                      STRING

  ,name_cn                      STRING

  ,biz_code                     int

  ,topic_code                   int

  ,procedure_code               int

  ,create_time                  timestamp

  ,update_time                  timestamp

  ,isdel                        tinyint

  ,PRIMARY KEY (`id`) NOT ENFORCED -- 如果要同步的数据库表定义了主键, 则这里也需要定义

) WITH (

  'connector' = 'mysql-cdc',      -- 固定值 'mysql-cdc'

  'hostname' = 'mysql地址',   -- 数据库的 IP

  'port' = '3306',                -- 数据库的访问端口

  'username' = 'user',        -- 数据库访问的用户名（需要提供 SHOW DATABASES、REPLICATION SLAVE、REPLICATION CLIENT、SELECT 和 RELOAD 权限）

  'password' = 'pass',    -- 数据库访问的密码

  -- 'scan.incremental.snapshot.enabled' = 'false' -- 如果 source 表没有设置 PRIMARY Key，需要启用该设置

  'database-name' = 'umetric',   -- 需要同步的数据库

  'table-name' = 'metrices'      -- 需要同步的数据表名

);

CREATE TABLE `stock_basic_iceberg_sink` (

  `id`  bigint NOT NULL,

  PRIMARY KEY(id) NOT ENFORCED

) WITH (

  'connector' = 'iceberg',

  'write.upsert.enabled'='true', -- 是否开启upsert

  'catalog-type' = 'hive',

  'catalog-name'='iceberg_catalog',

  'catalog-database'='bdg_app',

  'catalog-table'='test2',

  -- Hive metastore 的 thrift URI，可以从hive-site.xml配置文件中获取，对应的Key为：hive-metastore-uris

  'uri'='thrift://127.0.0.:7004',

  'engine.hive.enabled' = 'true',

  'format-version' = '2'

);

insert into stock_basic_iceberg_sink select id from test_mysql_metrices;

同步工具-Oceanus打通mysql到Iceberg的更多相关文章

数据库同步工具HKROnline SyncNavigator SQL Server互同步MySQL
需要联系我QQ:786211180 HKROnline SyncNavigator 是一款专业的 SQL Server, MySQL 数据库同步软件.它为您提供一种简单智能的方式完成复杂的数据库数据同 ...
mysql对比表结构对比同步,sqlyog架构同步工具
mysql对比表结构对比同步,sqlyog架构同步工具对比后的结果示例: 执行后的结果示例: 点击:"另存为(S)" 按钮可以把更新sql导出来.
MySQL表结构同步工具 mysql-schema-sync
mysql-schema-sync 是一款使用go开发的.跨平台的.绿色无依赖的 MySQL 表结构自动同步工具.用于将线上(其他环境)数据库结构变化同步到测试(本地)环境! 可以解决多人开发,每人都 ...
MySQL数据库同步工具的设计与实现
一.背景在测试过程中,对于不同的测试团队,出于不同的测试目的,我们可能会有多套测试环境.在产品版本迭代过程中,根据业务需求,会对数据库的结构进行一些修改,如:新增表.字段.索引,修改表.字段索引等操 ...
使用Canal作为mysql的数据同步工具
一.Canal介绍 1.应用场景在前面的统计分析功能中,我们采取了服务调用获取统计数据,这样耦合度高,效率相对较低,目前我采取另一种实现方式,通过实时同步数据库表的方式实现,例如我们要统计每天注册与 ...
[svc]打通mysql主从同步
MySQL数据库设置主从同步主从同步的特点: 逻辑的异步的主从同步的作用 1.备份 2.读写分离主从同步的步骤准备环境 1, mysql版本一致 5.5以上 2, 主从数据库一致主库mas ...
Spark记录-阿里巴巴开源工具DataX数据同步工具使用
1.官网下载下载地址:https://github.com/alibaba/DataX DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL.Oracle.SqlSe ...
袋鼠云研发手记 | 数栈·开源：Github上400+Star的硬核分布式同步工具FlinkX
作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...
Bireme：一个 Greenplum数据仓库的增量同步工具
https://hashdatainc.github.io/bireme/ Bireme 是一个 Greenplum / HashData 数据仓库的增量同步工具.目前支持 MySQL.Postgre ...
高可用数据同步方案-SqlServer迁移Mysql实战
简介随着业务量的上升,以前的架构已经不满足业务的发展,数据作为业务中最重要的一环,需要有更好的架构作为支撑.目前我司有sql server转mysql的需求,所以结合当前业务,我挑选了阿里云开源的一 ...

随机推荐

sqlite3之基础
最近在用Python借助于pySimpleGui做一个桌面小工具, 奉行小巧,简单的宗旨, 使用了本地数据库sqlite3来进行本地数据的存储参考: 官网: https://www.sqlite.o ...
Gitbook在Docker中安装插件的方法
别光在那百度,什么先book.json添加plugin,然后在install? 哥,你现在用的是docker哎,docker都启动不了,你如何gitbook install呢? 乖乖听我的,按我的方法 ...
04C++顺序结构（3）
一.设置域宽setw() 教学视频1 输出的内容所占的总宽度成为域宽,有些高级语言中称为场宽.使用setw()前,必须包含头文件iomanip,即#include.头文件iomanip,用来声明一些& ...
PDFSharp 1.5 更新
PDFsharp 1.50 Preview Information - PDFsharp & MigraDoc PDFShapr 1.50 修复与改进支持 Object Streams - ...
理解 ASP.NET Core：Cookie 认证
理解 ASP.NET Core:Cookie 认证 ASP.NET Core 内置提供了基于 Cookie 的认证支持.在使用 Cookie 验证的时候,相关的三要素: 认证模式名称:CookieAu ...
T语言开发笔记1
为什么会有开发语言的想法在2012年,我准备开发一个给前端切图使用的屏幕取色器. 需求很简单,前端经常需要获取设计稿特定位置的颜色代码.虽然当时 PhotoShop 提供了内部取色器,但操作麻烦,而 ...
我的世界服务端插件安装 AuthMe用户登录插件安装
Minecraft服务端插件安装-AuthMe用户登录插件安装需要准备AuthMe插件 AuthMe-5.6.0.jar用户登录插件例如使用/register <密码> <确认密 ...
Maven 插件 git-commit-id-plugin，打包包含提交信息
Maven打包发布版本可能会遇到自己的提交不起作用的情况,排查比较困难,可能需要拉下服务器上包,反编译查看是否包含自己的提交记录.如果使用的是GIT作为SCM,可以使用 git-commit-id-p ...
rocketMq4.2.0启动broker报错找不到或无法加载主类 Files\Java\jdk1.8.0_101\lib\dt.jar;C:\Program]
假如弹出提示框提示'错误: 找不到或无法加载主类 xxxxxx'.打开runbroker.cmd,然后将'%CLASSPATH%'加上英文双引号.保存并重新执行start语句.做如下图处理但是输出还 ...
Qt/C++音视频开发54-视频监控控件的极致设计
一.前言跌跌撞撞摸爬滚打一步步迭代完善到今天,这个视频监控控件的设计,在现阶段水平上个人认为是做的最棒的(稍微自恋一下),理论上来说应该可以用5年不用推翻重写,推翻重写当然也是程序员爱干的事情,这个 ...

同步工具-Oceanus打通mysql到Iceberg

同步工具-Oceanus打通mysql到Iceberg的更多相关文章

随机推荐

热门专题