[Spark]Spark-sql与hive连接配置

一.在Mysql中配置hive数据库

创建hive数据库，刷新root用户权限

create database hive;

grant all on *.* to root@'%' identified by'';

flush privileges;

修改hive目录下/bin/hive
vim /usr/local/src/apache-hive-1.2.2-bin/bin/hive

修改前

# add Spark assembly jar to the classpath

if [[ -n "$SPARK_HOME" ]]

then

  sparkAssemblyPath=`ls ${SPARK_HOME}/lib/spark-assembly-*.jar`

  CLASSPATH="${CLASSPATH}:${sparkAssemblyPath}"

修改后

# add Spark assembly jar to the classpath

if [[ -n "$SPARK_HOME" ]]

then

  sparkAssemblyPath=`ls ${SPARK_HOME}/jars/*.jar`

  CLASSPATH="${CLASSPATH}:${sparkAssemblyPath}"

fi

二.hadoop目录下存在老版的jline,替换掉

cd /usr/local/src

cp apache-hive-1.2.2-bin/lib/jline-2.12.jar hadoop-2.6.1/share/hado

op/yarn/lib/

三. 运行spark-shell

在spark目录下./spark-shell 运行后

scala> import org.apache.spark.sql.hive.HiveContext

import org.apache.spark.sql.hive.HiveContext

scala> val priors = spark.sql("select * from badou.orders")

报错：

// :: ERROR metastore.RetryingHMSHandler: AlreadyExistsException(message:Database default already exists)

// :: WARN component.AbstractLifeCycle: FAILED org.spark_project.jetty.server.Server@7b1e5e55: java.net.BindException: Address already in use

java.net.BindException: Address already in use

解决办法

步骤一 将hive-site.xml拷贝到spark/conf里

cp /usr/local/src/apache-hive-1.2.-bin/conf/hive-site.xml /usr/local/src/spark-2.0.-bin-hadoop2./conf/

scp /usr/local/src/apache-hive-1.2.-bin/conf/hive-site.xml root@slave1:/usr/local/src/spark-2.0.-bin-hadoop2./conf/

scp /usr/local/src/apache-hive-1.2.-bin/conf/hive-site.xml root@slave2:/usr/local/src/spark-2.0.-bin-hadoop2./conf/



步骤二 将mysql驱动拷贝到spark/jar里

cp /usr/local/src/apache-hive-1.2.-bin/lib/mysql-connector-java-5.1.-bin.jar /usr/local/src/spark-2.0.-bin-hadoop2./jars/

scp /usr/local/src/apache-hive-1.2.-bin/lib/mysql-connector-java-5.1.-bin.jar root@slave1:/usr/local/src/spark-2.0.-bin-hadoop2./jars/

scp /usr/local/src/apache-hive-1.2.-bin/lib/mysql-connector-java-5.1.-bin.jar root@slave2:/usr/local/src/spark-2.0.-bin-hadoop2./jars/

[Spark]Spark-sql与hive连接配置的更多相关文章

PHP 5.3版本上MS SQL Server的连接配置
折腾了好久,最后终于连接成功了! 注:我使用的的phpStudy. php.ini中配置: ;这是php中带的驱动 extension=php_sqlsrv.dll extension=php_pdo ...
SQL Server服务器连接配置
一.首先确保服务器能在本地打开数据库如果碰到本地无法连接到数据库,首先要确认上图中两个服务是否开启二.其次,要配置远端可连接的用户如图,配置数据库[属性]中[安全性]为混合验证,勾中允许远程连接 ...
SQL Server 远程连接配置
打开sql server配置工具 SQL Server网络配置→SQLEXPRESS的协议→启用TCP/IP→右键属性→IP地址→IPALL端口修改为1433→重启SQL Server服务 https ...
spark2.3.0 配置spark sql 操作hive
spark可以通过读取hive的元数据来兼容hive,读取hive的表数据,然后在spark引擎中进行sql统计分析,从而,通过spark sql与hive结合实现数据分析将成为一种最佳实践.配置步骤 ...
【Spark篇】---SparkSQL on Hive的配置和使用
一.前述 Spark on Hive: Hive只作为储存角色,Spark负责sql解析优化,执行. 二.具体配置 1.在Spark客户端配置Hive On Spark 在Spark客户端安装包下sp ...
Hive on Spark和Spark sql on Hive，你能分的清楚么
摘要:结构上Hive On Spark和SparkSQL都是一个翻译层,把一个SQL翻译成分布式可执行的Spark程序. 本文分享自华为云社区<Hive on Spark和Spark sql o ...
Spark SQL with Hive
前一篇文章是Spark SQL的入门篇Spark SQL初探,介绍了一些基础知识和API,可是离我们的日常使用还似乎差了一步之遥. 终结Shark的利用有2个: 1.和Spark程序的集成有诸多限制 ...
spark sql数据源--hive
使用的是idea编辑器 spark sql从hive中读取数据的步骤:1.引入hive的jar包 2.将hive-site.xml放到resource下 3.spark sql声明对hive的支持案 ...
Spark之SQL解析（源码阅读十）
如何能更好的运用与监控sparkSQL?或许我们改更深层次的了解它深层次的原理是什么.之前总结的已经写了传统数据库与Spark的sql解析之间的差别.那么我们下来直切主题~ 如今的Spark已经支持多 ...

随机推荐

Spring Boot 2.X(三)：使用 Spring MVC + MyBatis + Thymeleaf 开发 web 应用
前言 Spring MVC 是构建在 Servlet API 上的原生框架,并从一开始就包含在 Spring 框架中.本文主要通过简述 Spring MVC 的架构及分析,并用 Spring Boot ...
搭建docker+swoole+php7 的环境
最近在学习swoole php扩展,苦恼于其运行环境不能在win系统下运行, 但开发代码一直在win系统上,很无奈,,,, 所以就用docker来代替,舒服~ 有很多相关docker的swoole镜像 ...
Spring Security 学习记录
一.核心拦截器详细说明 1.WebAsyncManagerIntegrationFilter 根据请求封装获取WebAsyncManager 从WebAsyncManager获取/注册Security ...
liunx下安装MySQL
1．安装依赖包:yum -y install gcc gcc-c++ ncurses ncurses-devel cmake bisonyum install -y perl-Module-Insta ...
idea配置maven以及手动添加webapp目录
idea配置maven 点击右下角Configure 点击settings 3 . 设置路径设置自动导包 4 . 点击创建新工程 5 . 选择maven点击下一步 6 . 7 . 8 . 此时,创建 ...
题解：2018级算法第二次上机 Zexal的流水线问题
题目描述: 样例: 实现解释: 最基础的流水线调度问题,甚至没有开始和结束的值实现方法即得出状态转移方程后完善即可,设a[][i]存储着第一二条线上各家的时间花费,t[][i]存储着i处进行线路切换 ...
x509: certificate is valid for 10.96.0.1, 172.18.255.243, not 120.79.23.226
服务器:阿里云服务器 master:120.79.23.226 node:39.108.131.246 系统:Centos 7.4 node节点加入集群中是报错: x509: certificate ...
web安全之php中常见的INI文件配置
php.ini 在 PHP 启动时被读取.对于服务器模块版本的 PHP,仅在 web 服务器启动时读取一次.对于 CGI 和 CLI 版本,每次调用都会读取. * Apache web 服务器在启动 ...
HDU 6607 Time To Get Up(状态压缩+枚举)
题目网址: http://acm.hdu.edu.cn/showproblem.php?pid=6077 思路: 先预处理一下,将每个数字块的“X”看作1,“.”看作0,进行状态压缩转换成二进制数,用 ...
高性能Web动画和渲染原理系列（3）——transform和opacity为什么高性能
示例代码托管在:http://www.github.com/dashnowords/blogs 博客园地址:<大史住在大前端>原创博文目录华为云社区地址:[你要的前端打怪升级指南] [T ...

[Spark]Spark-sql与hive连接配置

一.在Mysql中配置hive数据库

二.hadoop目录下存在老版的jline,替换掉

三. 运行spark-shell

解决办法

[Spark]Spark-sql与hive连接配置的更多相关文章

随机推荐

热门专题