presto整合hive

Presto安装

前提条件： hadoop安装好了（并启动了） + hive安装好了

文档网址：http://prestodb.jd.com/docs/current/installation/deployment.html

　　首先解压下载好的tar.gz包

　　 1 .安装包 https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.100/presto-server-0.100.tar.gz

2. 客户端连接包下载： https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.100/presto-cli-0.100-executable.jar

　　解压presto-server-0.100.tar.gz 然后进入创建etc文件夹，新建下面文件夹和文件

　　hadoop文件夹: hadoop的配置文件：hdfs-site.xml core-site.xml

　　node.properties：每个节点的环境配置

　　jvm.config：jvm 参数

　　config.properties：配置 Presto Server 参数

　　log.properties：配置日志等级

　　Catalog ：Catalog 文件夹，下面放各个数据的配置文件比如hive.properties

　1>node.properties配置

node.environment=production

node.id=1

node.data-dir=/home/kevin/software/presto-server-0.100/data

　　节点配置node.id=1

　　切记:每个节点不能重复我本地把协调和生产节点部署到了一起

　2>config.properties

coordinator=true

node-scheduler.include-coordinator=true

http-server.http.port=8080

task.max-memory=1GB

discovery-server.enabled=true

discovery.uri=http://192.168.43.20:8080

　3>catalog /hive.properties的配置

　　connector.name是连接器，我是apache2*版本的，所以我用hive-hadoop2

connector.name=hive-hadoop2

hive.metastore.uri=thrift://192.168.43.20:9083

hive.config.resources=/home/kevin/software/presto-server-0.100/etc/hadoop/core-site.xml,/home/kevin/software/presto-server-0.100/etc/hadoop/hdfs-site.xml

　4>jvm.config配置

-server

-Xmx16G

-XX:+UseConcMarkSweepGC

-XX:+ExplicitGCInvokesConcurrent

-XX:+CMSClassUnloadingEnabled

-XX:+AggressiveOpts

-XX:+HeapDumpOnOutOfMemoryError

-XX:OnOutOfMemoryError=kill -9 %p

-XX:ReservedCodeCacheSize=150M

　　这个可以根据自己的机器配置进行相应调整

　5>log.properties配置

com.facebook.presto=INFO

　　配置完成之后，可以运行presto服务了，如果目录权限不够，使用如下命令（我自己是kevin）

chown -R kevin:kevin /home/presto

　　presto服务的启动方式有两种，第一种是start后台运行看不到日志输出，run前台运行，可在前台看到打印日志，建议前期使用run进行前台运行

　　当出现这样的关键词时，恭喜搭建完成

　　接下来可以测试一下，我们使用一个工具presto-cli-0.100-executable.jar 下载之后，重命名为presto-cli 并加上权限

mv presto-cli-0.100-executable.jar presto-cli

sudo chmod +x ./presto-cli

　　启动Hive服务（如果是后台启动，后面加上&）

Presto客户端连接

./presto-cli --server localhost:8080 --catalog hive --schema default

如上命令行,可以执行一下show tables;进行测试

presto整合hive的更多相关文章

Spring boot整合Hive
使用Spring boot整合Hive,在启动Spring boot项目时,报出异常: java.lang.NoSuchMethodError: org.eclipse.jetty.servlet.S ...
使用Spring boot整合Hive，在启动Spring boot项目时，报错
使用Spring boot整合Hive,在启动Spring boot项目时,报出异常: java.lang.NoSuchMethodError: org.eclipse.jetty.servlet.S ...
SparkSql 整合 Hive
SparkSql整合Hive 需要Hive的元数据,hive的元数据存储在Mysql里,sparkSql替换了yarn,不需要启动yarn,需要启动hdfs 首先你得有hive,然后你得有spark, ...
Spark整合Hive
spark-sql 写代码方式 1.idea里面将代码编写好打包上传到集群中运行,上线使用 spark-submit提交 2.spark shell (repl) 里面使用sqlContext 测试使 ...
大数据学习day25------spark08-----1. 读取数据库的形式创建DataFrame 2. Parquet格式的数据源 3. Orc格式的数据源 4.spark_sql整合hive 5.在IDEA中编写spark程序（用来操作hive） 6. SQL风格和DSL风格以及RDD的形式计算连续登陆三天的用户
1. 读取数据库的形式创建DataFrame DataFrameFromJDBC object DataFrameFromJDBC { def main(args: Array[String]): U ...
HBase（六）HBase整合Hive，数据的备份与MR操作HBase
一.数据的备份与恢复 1. 备份停止 HBase 服务后,使用 distcp 命令运行 MapReduce 任务进行备份,将数据备份到另一个地方,可以是同一个集群,也可以是专用的备份集群. 即,把数 ...
Spark之 SparkSql整合hive
整合: 1,需要将hive-site.xml文件拷贝到Spark的conf目录下,这样就可以通过这个配置文件找到Hive的元数据以及数据存放位置. 2,如果Hive的元数据存放在Mysql中,我们还需 ...
Hive presto和hive时间格式转换
1.北京时间格式 to unix时间格式数据格式: 2017-11-17 08:28:13 2017-11-17 08:28:10 2017-11-17 08:27:51.343 2017- ...
presto和hive日期函数对比
时间格式转换日期格式→Unix时间戳转10位Unix时间戳数据:2020-07-23 15:01:13 Presto:select to_unixtime(cast('2020-07-23 15 ...

随机推荐

Logstash处理数据用法示例---待完善
filter { mutate { rename => [ "message", "blog_html" ] copy => { "blo ...
yield return,yield break
转自, http://www.cnblogs.com/kingcat/archive/2012/07/11/2585943.html yield return 表示在迭代中下一个迭代时返回的数据,除此 ...
.net webapi跨域问题
2019年11月8日,近期做项目开始实行前后端分离的方式开发,前端使用vue的框架,打包发布后,调用后端接口出现跨域的问题,网上搜索出来的都是以下的配置方式: 但是,在我的项目中,按这种方式配置没有效 ...
Go语言中初始化变量中字面量&Type{}、new、make的区别
Go语言中new和make是内建的两个函数,主要用来创建分配类型内存.在我们定义生成变量的时候,可能会觉得有点迷惑,其实他们的规则很简单,下面我们就通过一些示例说明他们的区别和使用. 变量的声明 va ...
面向对象的六大原则之单一职责原则——SRP
SRP = Single Responsibility Principle 定义:就一个类而言,应该只有一个能引起他变化的原因.通俗的说,即一个类只负责一项职责. 作用: 1.减少了类之间的耦 ...
【Linux】扩展阿里云数据盘分区和文件系统
扩容云盘只是扩大存储容量,不会扩容文件系统一.准备工作在扩展数据盘扩展分区和文件系统前,请提前完成以下工作. 创建快照以备份数据,防止操作失误导致数据丢失. 通过ECS控制台或者API扩容云盘容量 ...
Java并行程序基础。
并发,就是用多个执行器(线程)来完成一个任务(大任务)来处理业务(提高效率)的方法.而在这个过程中,会涉及到一些问题,所以学的就是解决这些问题的方法. 线程的基本操作: 1.创建线程:只需要new一个 ...
Shell脚本（2）
命令替换: Shell脚本可以从命令输出中提取信息,并将其赋给变量方法: 1.反引号字符:` 2.格式:$() 例子:#/bin/bash test=$(date) echo "the d ...
(十)OpenStack---M版---双节点搭建---Heat安装和配置
↓↓↓↓↓↓↓↓视频已上线B站↓↓↓↓↓↓↓↓ >>>>>>传送门本章节仅在Controller节点执行 1.Controller节点执行安装和配置 2.验证操作 ...
Ubuntu 16.04/18.04 右键创建新建文件
刚刚安装完新的Ubuntu系统后不能直接右键创建新的文件,那么怎么做呢办法: 打开终端,cd 切换到 Templates文件夹下,然后输入: sudo gedit text 这样就在Template ...

presto整合hive

presto整合hive的更多相关文章

随机推荐

热门专题