presto集成iceberg

一、Presto服务下新建catelog

cd /usr/local/service/presto/etc/catalog

vim iceberg.properties

connector.name=iceberg

#iceberg.catalog.type=hive_metastore

hive.metastore.uri=thrift://127.0.0.1:7004,thrift://......

hive.config.resources=/usr/local/service/hadoop/etc/hadoop/core-site.xml,/usr/local/service/hadoop/etc/hadoop/hdfs-site.xml

hive.hdfs.authentication.type=KERBEROS

hive.hdfs.impersonation.enabled=true

hive.hdfs.presto.keytab=/var/krb5kdc/emr.keytab

hive.hdfs.presto.principal=hadoop/_HOST@EMR....

hive.metastore.authentication.type=KERBEROS

hive.metastore.client.keytab=/var/krb5kdc/emr.keytab

hive.metastore.client.principal=hadoop/_HOST@EMR....

hive.metastore.service.principal=hadoop/_HOST@EMR....

hive.recursive-directories=true

二、复制jar包到presto的iceberg catalog下

可以从hive目录下拷贝，没有的话需要去下载（用了腾讯chdfs没用这些技术的话可以少拷贝）

cp goosefs-1.1.0-SNAPSHOT-client.jar ../iceberg/

cp cosn-ranger-interface-1.0.4.jar ../iceberg/

cp hadoop-ranger-client-for-presto-2.8.5-5.0.jar ../iceberg/

cp hadoop-temrfs-2.8.5-8.1.4-1.0.6.jar ../iceberg/

cp chdfs_hadoop_plugin_network-* ../iceberg/

cp gson-2.2.4.jar  ../iceberg/

三、重启presto的所有节点（测试时可以先用PrestoSQL-Coordinator）

三、测试

/usr/local/service/presto/presto-client/presto --server 127.0.0.1:9000 --catalog iceberg --schema data_lake_ods --user hadoop

presto集成iceberg的更多相关文章

presto集成kerberos以及访问集成了kerberos的hive集群
1.创建主体注: 192.168.0.230 为单节点集群 192.168.4.50为kdc服务器 192.168.0.9为客户端 1.1.Kdc服务器创建主体 # kadmin.local -q ...
使用 Iceberg on Kubernetes 打造新一代云原生数据湖
背景大数据发展至今,按照 Google 2003年发布的<The Google File System>第一篇论文算起,已走过17个年头.可惜的是 Google 当时并没有开源其技术,& ...
Apache Hudi和Presto的前世今生
一篇由Apache Hudi PMC Bhavani Sudha Saktheeswaran和AWS Presto团队工程师Brandon Scheller分享Apache Hudi和Presto集成 ...
看SparkSql如何支撑企业数仓
企业级数仓架构设计与选型的时候需要从开发的便利性.生态.解耦程度.性能. 安全这几个纬度思考.本文作者:惊帆来自于数据平台 EMR 团队前言 Apache Hive 经过多年的发展,目前基本已经成 ...
Lakehouse架构指南
你曾经是否有构建一个开源数据湖来存储数据以进行分析需求? 数据湖包括哪些组件和功能? 不了解 Lakehouse 和数据仓库之间的区别? 或者只是想管理数百到数千个文件并拥有更多类似数据库的功能但 ...
六大主流开源SQL引擎
导读本文涵盖了6个开源领导者:Hive.Impala.Spark SQL.Drill.HAWQ 以及Presto,还加上Calcite.Kylin.Phoenix.Tajo 和Trafodion.以 ...
主流开源SQL（on Hadoop）总结
转载至大数据杂谈 (BigdataTina2016),同时参考学习 http://www.cnblogs.com/barrywxx/p/4257166.html 进行整理. 使用SQL 引擎一词是有 ...
六大主流开源SQL引擎总结
本文涵盖了6个开源领导者:Hive.Impala.Spark SQL.Drill.HAWQ 以及Presto,还加上Calcite.Kylin.Phoenix.Tajo 和Trafodion.以及2个 ...
官宣！Amazon EMR正式支持Apache Hudi
Apache Hudi是一个开源的数据管理框架,其通过提供记录级别的insert, update, upsert和delete能力来简化增量数据处理和数据管道开发.Upsert指的是将记录插入到现有 ...
6大主流开源SQL引擎总结，遥遥领先的是谁？
根据 O’Reilly 2016年数据科学薪资调查显示,SQL 是数据科学领域使用最广泛的语言.大部分项目都需要一些SQL 操作,甚至有一些只需要SQL.本文就带你来了解这些主流的开源SQL引擎!背景 ...

随机推荐

Python:pygame游戏编程之旅七（pygame基础知识讲解1）
与Python自带的random.math.time等模块一样,Pygame框架也带有许多模块来提供绘图.播放声音.处理鼠标输入等功能. 本章将讲述Pygame提供的基本模块及功能,并假设读者已经具有 ...
动态配置生成echarts图表
动态配置x轴和y轴的数据,并且可以选择柱状图.折线图.饼状图等图形父组件代码: <template> <div class="reportPicture"> ...
Winform Tab增加关闭标签页
Winform的Tab控件,有新增有移除,但是呢,缺了一个标签页上的关闭按钮,这个东西说重要也重要,说不重要也不重要. 这里就说一下怎么添加这玩意. 这玩意需要重绘tab控件,所以我们需要处理Draw ...
The 2023 ICPC Asia Hong Kong Regional Programming Contest
The 2023 ICPC Asia Hong Kong Regional Programming Contest A. TreeScript 给你一个根,让你构造一棵树,每个节点被创造的时候必须知道 ...
Java基础 —— 集合（一）
集合(一) 数组和集合的区别数组是固定长度的数据结构,而集合是动态的数据结构数组可以包含基本数据类型和对象,集合只能包含对象数组只能存放同一类型的数据,而集合可以蹲房不同类型的数组可以直接访问 ...
git代码同步,代码同步到码云中
首先在需要同步的代码根目录下打开终端,这里是在vscode的终端操作的,也可以用cmd 进入到项目目录,输入git status查看代码同步状态, 提示内红色的都是有变化的代码 git status ...
前端每日一知之让Chrome支持小于12px的文字
脑图在线链接本文内容依据[js每日一题]公众号精彩文章总结而来
ADB安装与环境配置
前言 ADB(Android debug bridge)是可以操作Android设备的命令行工具安装点击链接即可直接下载 Windows https://dl.google.com/android ...
GitLab的备份与恢复
一.备份 1. docker执行备份 docker exec gitlab gitlab-rake gitlab:backup:create 默认将备份文件保存至docker的/var/opt/git ...
.NET Core 异常(Exception)底层原理浅谈
中断与异常模型图内中断内中断是由 CPU 内部事件引起的中断,通常是在程序执行过程中由于 CPU 自身检测到某些异常情况而产生的.例如,当执行除法运算时除数为零,或者访问了不存在的内存地址,CPU ...

presto集成iceberg

presto集成iceberg的更多相关文章

随机推荐

热门专题