HDP Spark2 HIVE3.1 的问题

HDP 上安装了 Hive3.1 和 Spark2, 提交 Spark 作业时，报找不到 Hive 中表的问题

但是查一了下 hive 表，明明是存在这个表的。查看日志，注意到如下的一段日志。

没修改值之前，我在 Spark-shell 里创建了一张 hive 表，发现其创建的位置是 spark.sql.warehouse.dir 指向的目录，不在 hive.metastore.warehouse.dir 目录里 (其实这个值在 hive 中的配置，但是 spark 的 conf 下的目录里没有配置)。我在 spark 的 conf 目录里增加了 hive.metastore.warehouse.dir 的值，使其与 hive 中配置的值一样。可是我修改后，在 spark-shell 里查寻表时，依然显示是刚才创建的表。我把 spark.sql.warehouse.dir 的值也改成 hive.metastore.warehouse.dir 的值，仍然如此。

网上的另外几种方法：

1. 把 hive-site.xml 复制到 Spark 的 conf 目录下。

我看了一下 spark 的 conf 目录，有 hive-site.xml 这个表的，而且从日志中也可以看到 spark 能找到 hive 的 thrift://datacenter2:9083 这个地址，说明没问题。

2. 创建 spark session 的时候要启用 hive。

val ss = SparkSession.builder().appName("统计").enableHiveSupport().getOrCreate()

我的程序里有启用的，所以也不是原因。

3. 关闭 Hive 3 中的默认的 ACID 功能，修改如下几个参数

hive.strict.managed.tables=false

hive.create.as.insert.only=false

metastore.create.as.acid=false

试过之后，问题依旧。

崩溃了，找不到其它解决方法了。先记录一下。

================================================

有别的事，先做别的了。过了2天，抱着试试看的态度，在 /etc/spark2/3.1.0.0-78/0 下建了个软链接到 /etc/hive/conf 下的 hive-site.xml ，竟然找得到表了。通过比较，发现原 spark 下的 hive-site.xml 里多了一个 metastore.catalog.default 的配置，值是 spark。在网上搜了一下，才知道要改成 hive 才可以读 hive 下创建的表。这个值我理解的是表示hive仓库的命名空间。为什么 Spark 没有默认设置成 hive 的 catalog 的呢？因为 HDP 3.1 中的 hive 会默认开启 ACID，spark 读取 ACID 的表时，会出错，所以设置了一个 spark 的 catalog。

HDP Spark2 HIVE3.1 的问题的更多相关文章

Ambari HDP 下 SPARK2 与 Phoenix 整合
1.环境说明操作系统 CentOS Linux release 7.4.1708 (Core) Ambari 2.6.x HDP 2.6.3.0 Spark 2.x Phoenix 4.10.0-H ...
spark2.4.0+hadoop2.8.3全分布式集群搭建
集群环境 hadoop-2.8.3搭建详细请查看hadoop系列文章 scala-2.11.12环境请查看scala系列文章 jdk1.8.0_161 spark-2.4.0-bin-hadoop2. ...
Ubuntu 16.04.4 LTS + Ambari 2.6.1.5 + HDP 2.6.4.0 安装部署
服务器主机名 master slave1 slave2 slave3 IP 192.168.1.40 192.168.1.41 192.168.1.42 192.168.1.43 离线包服务器: 1 ...
ambari 2.6.2 安装 hdp 2.6.5.0 遇到的问题
1.hive-client 无法安装一直报错(symlink target already exists and it is not a symlink.),hive-client 已经存在且不是 ...
Spark-2.3.2【SparkStreaming+SparkSQL-实时仪表盘应用】
应用场景:实时仪表盘(即大屏),每个集团下有多个mall,每个mall下包含多家shop,需实时计算集团下各mall及其shop的实时销售分析(区域.业态.店铺TOP.总销售额等指标)并提供可视化展现 ...
HDP 企业级大数据平台
一前言阅读本文前需要掌握的知识: Linux基本原理和命令 Hadoop生态系统(包括HDFS,Spark的原理和安装命令) 由于Hadoop生态系统组件众多,导致大数据平台多节点的部署,监控极其 ...
geotrellis使用（二十五）将Geotrellis移植到spark2.0
目录前言升级spark到2.0 将geotrellis最新版部署到spark2.0(CDH) 总结一.前言事情总是变化这么快,前面刚写了一篇博客介绍如何将geotrellis移植 ...
Ubuntu14.04或16.04下安装JDK1.8+Scala+Hadoop2.7.3+Spark2.0.2
为了将Hadoop和Spark的安装简单化,今日写下此帖. 首先,要看手头有多少机器,要安装伪分布式的Hadoop+Spark还是完全分布式的,这里分别记录. 1. 伪分布式安装伪分布式的Hadoo ...
maven+spark2.0.0最大连通分量
运用到了spark2.0.0的grarhx包,要手动的在pom.xml里面添加依赖包,要什么就在里面添加依赖,然后在run->maven install

随机推荐

UNITY 接讯飞语音过程总结
11:13 2017/3/141,安装问题:JDK与ECLIPSE位数一定要对应,32位对64位会出现 java was returned ....code 13的弹框错误.版本号可以不一致.2,EC ...
confd test
vi /etc/confd/confd.toml backend = "consul"confdir = "/etc/confd"log-level = &qu ...
利用 Chrome 原生工具进行网页长截图
转自https://sspai.com/post/42193 要想使用截图功能,你需要首先确保 Chrome 已升级至 59 或更高版本.在想要截图的网页中,首先按下 ⌘Command + ⌥Opti ...
SpringMVC学习总结（一）--Hello World入门
一.什么是Spring MVC Spring MVC属于SpringFrameWork的后续产品,已经融合在Spring Web Flow里面.Spring 框架提供了构建 Web 应用程序的全功能 ...
Multithreading in C
Multithreading in C, POSIX(可移植操作系统接口Portable Operating System Interface X ) style Multithreading - A ...
C语言中的序列点和副作用
参考: http://www.2cto.com/kf/201210/161225.html
Eclipse下初用lucene
lucene是apache的一个开源项目,一个开放源代码的全文检索引擎工具包. 1. 首先下载lucene,下载地址来自<lucene实战>第2版(页面加载比较忙,等~) http://w ...
Java开发环境之------MyEclipse快捷键和排除错误第一选择ctrl+1(***重点***：ctrl+1，快速修复---有点像vs中的快速using
using Java开发环境之------MyEclipse快捷键和排除错误第一选择ctrl+1(***重点***:ctrl+1,快速修复---有点像vs中的快速using 2015-06-29 浏览 ...
apicloud 和微信小程序，你会用哪个?
微信小程序开始火了,app跨平台的革命再次高涨,不得不说,不用再担心android和ios双版本开发成本,及h5的开发和apicloud一样,不需要关注平台问题,只需要关注前端js.css就能大a ...
超级详细的解决方法（CentOS7） :永久修改 mysql read-only 问题 could not retrieve transation read-only status server
一.查看mysql的事物隔离级别 SHOW VARIABLES LIKE '%iso%'; 二.临时修改事物隔离级别 SET GLOBAL tx_isolation='READ-COMMITTED'; ...

HDP Spark2 HIVE3.1 的问题

HDP Spark2 HIVE3.1 的问题的更多相关文章

随机推荐

热门专题