hive on spark 30041 连接超时

2024-10-18

hive on spark：return code 30041 Failed to create Spark client for Spark session原因分析及解决方案探寻

最近在Hive中使用Spark引擎进行执行时(set hive.execution.engine=spark),经常遇到return code 30041的报错,为了深入探究其原因,阅读了官方issue.相关博客进行了研究.下面从报错现象.原因分析.解决方案几个方面进行介绍,最后做一下小结. (一)报错现象 ERROR : FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.Sp

Hive On Spark保姆级攻略

声明: 此博客参考了官网的配置方式,并结合笔者在实践网上部分帖子时的踩坑经历整理而成这里贴上官方配置说明: [官方]: https://cwiki.apache.org//confluence/display/Hive/Hive+on+Spark:+Getting+Started 大前提: 从Hive1.1开始支持使用Spark作为执行引擎,我们配置使用Spark On Yarn时,一定要注意 Hive版本与Spark版本的适配,不适配的需要自己重新编译使其适配这里贴上官方推荐的对应版本 H

Hive(十三)【Hive on Spark 部署搭建】

Hive on Spark 官网详情:https://cwiki.apache.org//confluence/display/Hive/Hive+on+Spark:+Getting+Started 一.安装Hive 具体安装参考:Hive(一)[基本概念.安装] 安装和Spark对应版本一起编译的Hive,当前官网推荐的版本关系如下: HiveVersion SparkVersion 1.1.x 1.2.0 1.2.x 1.3.1 2.0.x 1.5.0 2.1.x 1.6.0 2.2.x 1

Hive on Spark安装配置详解（都是坑啊）

个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Spark,在执行以下步骤之前,请先确保已经安装Hadoop集群,Hive,MySQL,JDK,Scala,具体安装步骤不再赘述. 背景 Hive默认使用MapReduce作为执行引擎,即Hive on mr.实际上,Hive还可以使用Tez和Spark作为其执行引擎,分别为Hive on Tez和Hi

大数据学习系列之九---- Hive整合Spark和HBase以及相关测试

前言在之前的大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为hive默认使用的引擎是MapReduce.因此就将spark作为hive的引擎来对hbase进行查询,在成功的整合之后,我将如何整合的过程写成本篇博文.具体如下! 事前准备在进行整合之前,首先确保Hive.HBase.Spark的环境已经搭建成功!如果没有成功搭建,具体可以看我之前写的大数据学习系

hive on spark的坑

原文地址:http://www.cnblogs.com/breg/p/5552342.html 装了一个多星期的hive on spark 遇到了许多坑.还是写一篇随笔,免得以后自己忘记了.同事也给我一样苦逼的人参考. 先说明一下,这里说的Hive on Spark是Hive跑在Spark上,用的是Spark执行引擎,而不是MapReduce,和Hive on Tez的道理一样. 先看官网的资源Hive on Spark: Getting Started 要想在Hive中使用Spark执行引擎,

Hive、Spark SQL、Impala比较

Hive.Spark SQL.Impala比较 Hive.Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点.前面已经讨论了Hive和Impala,本节先介绍一下SparkSQL,然后从功能.架构.使用场景几个角度比较这三款产品的异同,最后附上分别由cloudera公司和SAS公司出示的关于这三款产品的性能对比报告.1. Spark SQL简介 Spark SQL是Spark的一个处理结构化数据的程序模块.与其

hive使用spark引擎的几种情况

使用spark引擎查询hive有以下几种方式:1>使用spark-sql(spark sql cli)2>使用spark-thrift提交查询sql3>使用hive on spark(即hive本身设置执行引擎为spark)针对第一种情况:1>ambari 已经支持,不需要特殊配置:2>cdh不支持spark sql cli,原因是cdh自带的spark,spark-sql和spark-R是阉割版本的,如果需要使用spark sql cli,需要下载原生的编译好的spark包

Mac OSX系统中Hadoop / Hive 与 spark 的安装与配置环境搭建记录

Mac OSX系统中Hadoop / Hive 与 spark 的安装与配置环境搭建记录 Hadoop 2.6 的安装与配置(伪分布式) 下载并解压缩配置 .bash_profile : export HADOOP_HOME=/Users/fan/Applications/hadoop-2.6.0 export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH 配置 HDFS : etc/hadoop/core-site.xml: <con

Hive on Spark和Spark sql on Hive，你能分的清楚么

摘要:结构上Hive On Spark和SparkSQL都是一个翻译层,把一个SQL翻译成分布式可执行的Spark程序. 本文分享自华为云社区<Hive on Spark和Spark sql on Hive有啥区别?>,作者:dayu_dls . 结构上Hive On Spark和SparkSQL都是一个翻译层,把一个SQL翻译成分布式可执行的Spark程序.Hive和SparkSQL都不负责计算.Hive的默认执行引擎是mr,还可以运行在Spark和Tez.Spark可以连接多种数据源,然后

关于MySQL的wait_timeout连接超时问题报错解决方案

bug回顾 : 想必大家在用MySQL时都会遇到连接超时的问题,如下图所示: ### Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: The last packet successfully received from the server was 47,795,922 milliseconds ago. The last packet sent successfully to the server was 47,7

Linux Vsftpd 连接超时解决方法（被动模式）

http://blog.csdn.net/qq_15766181/article/details/46554643 使用 FileZilla FTP Client 连接 Vsftpd FTP,在没有配置传输模式(主动模式.被动模式)时,出现了以下提示信息.我们可以手工设置传输模式为“主动模式”来解决这一问题.但由于客户端防火墙等原因,这种解决方法将不会始终有效. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 状态: 正在连接 192.168

修改tnsnames.ora文件中配置内容中的连接别名后，连接超时解决办法

1.tnsnames.ora文件中配置内容中的连接别名:由upaydb修改为IP地址 2.连接超时定位原因: PLSQL登录界面的数据库列表就是读的tnsname.ora中连接的别名,这个文件中连接别名修改后,那么你PLSQL登录数据库时也要选择对应的连接别名:

Hive On Spark概述

Hive现有支持的执行引擎有mr和tez,默认的执行引擎是mr,Hive On Spark的目的是添加一个spark的执行引擎,让hive能跑在spark之上: 在执行hive ql脚本之前指定执行引擎.spark.home.spark.master set hive.execution.engine=spark; set spark.home=/home/spark/app/spark--bin-spark-without-hive; set spark.master=yarn; Hive O

Hive On Spark环境搭建

Spark源码编译与环境搭建 Note that you must have a version of Spark which does not include the Hive jars; Spark编译: git clone https://github.com/apache/spark.git spark_src cd spark_src export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512

SQL Server 连接超时案例一则

上周六,一工厂系统管理员反馈一数据库连接不上,SSMS连接数据库报"连接超时时间已到.在尝试使用预登录握手确认时超过了此超时时间.......", 如下截图所示: 另外远程连接也连接不上,系统管理员只能通过vSphere Client连接到这台服务器,我这边也无法远程登录检查具体情况,ping 这台服务器发现网络正常,没有丢包或时延严重情况,那我就在Linux上使用nmap扫描了一下这台服务器端口情况,发现1433端口没有开放,另外发现该服务器居然没有一个端口对外开放. [oracle

SSRS报表连接超时的问题

这段时间遇到一个问题就是ReportService 中采用了远程连接的报表偶尔会断开连接,导致报表导出异常,查阅了很多资料,几天来就是断断续续的终于解决了这个问题,下面把一些解决的点一一展示出来,便于大家将来遇到同样问题无从下手. 首先是报错,接下来我马上去看日志,很多人不知道文件的位置,一般默认就是这个路径(Program Files\Microsoft SQL Server\MSRS11.MSSQLSERVER\Reporting Services\LogFiles). 主要的错误如下: 1

Linux Vsftpd 连接超时解决方法

Linux Vsftpd 连接超时解决方法 2013-11-13 10:58:34| 分类: 默认分类|举报|字号订阅解决方法(http://www.lingdus.com/thread-8189-1-1.html) 在服务端配置被动模式就可以从根源上解决这问题.1.编辑 Vsftpd 配置文件 vi /etc/vsftpd/vsftpd.conf 复制代码 2.在最下面添加以下信息 pasv_enable=YES #开启被动模式 pasv_min_port=4000 #随

(转)hbase master挂掉-zookeeper连接超时原因

link:http://www.51testing.com/?uid-445759-action-viewspace-itemid-812467 并行运行hbase删表,建表操作,多个表多个region,导致hbase挂掉. 查看日志: 从日志中可以看出GC时间过长导致zookeeper连接超时,master退出.(是master退出而不是regionserver退出是因为进行的操作是建表,删表,是由master来进行操作的). 原因: hbase中和GC相关的参数: 修改前(默认): expo

Oracle连接超时

客户机要想连接 oracle服务机(装了数据库的机子),只需要在客户机配置一个本地服务名就行了,不管你用Oracle服务端的配置工具还是客户端的配置工具,都没有问题. 如果只是客户机连接服务机,也不用启动什么Oracle服务,只要服务机的监听服务/数据库服务开启就行了. 我连接超时的原因是:忘了插网线了.

hive on spark 30041 连接超时

热门专题