Spark SQL Hive Support Demo

前提：

1、spark1.0的包编译时指定支持hive：./make-distribution.sh --hadoop 2.3.0-cdh5.0.0 --with-yarn --with-hive --tgz

2、安装完spark1.0；

3、拷贝mysql驱动包到$SPARK_HOME/lib下；

Spark SQL 支持Hive案例：

1、将hive-site.xml配置文件拷贝到$SPARK_HOME/conf下，编译时已经将hive打到包中了，故此处只需要hive-site配置文件即可

hive-site.xml文件内容形如：

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

    <property>

      <name>javax.jdo.option.ConnectionURL</name>

      <value>jdbc:mysql://hadoop000:3306/hive?createDatabaseIfNotExist=true</value>

    </property>

    <property>

      <name>javax.jdo.option.ConnectionDriverName</name>

      <value>com.mysql.jdbc.Driver</value>

    </property>

    <property>

      <name>javax.jdo.option.ConnectionUserName</name>

      <value>root</value>

    </property>

    <property>

      <name>javax.jdo.option.ConnectionPassword</name>

      <value>root</value>

    </property>

</configuration>

2、启动spark： spark-shell

案例来源于spark官方文档：http://spark.apache.org/docs/latest/sql-programming-guide.html

//创建hiveContext

val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)

// 隐式转换

import hiveContext._

//创建hive表

hql("CREATE TABLE IF NOT EXISTS hive.kv_src (key INT, value STRING)")

//加载数据到hive表

hql("LOAD DATA LOCAL INPATH '/home/spark/app/spark-1.0.0-bin-2.3.0-cdh5.0.0/examples/src/main/resources/kv1.txt' INTO TABLE hive.kv_src")

//通过hql查询

hql("FROM hive.kv_src SELECT key, value").collect().foreach(println)

详细信息参见官方文档：http://spark.apache.org/docs/latest/sql-programming-guide.html

Spark SQL Hive Support Demo的更多相关文章

Caused by: java.sql.SQLException: Failed to start database 'metastore_db' with class loader org.apache.spark.sql.hive.client.IsolatedClientLoader$$anon$1@d7c365, see the next exception for details.
解决方法:https://stackoverflow.com/questions/37442910/spark-shell-startup-errors 异常: 18/01/29 19:04:27 W ...
local模式运行spark-shell时报错 java.lang.IllegalArgumentException: Error while instantiating 'org.apache.spark.sql.hive.HiveSessionState':
先前在local模式下,什么都不做修改直接运行./spark-shell 运行什么问题都没有,然后配置过在HADOOP yarn上运行,之后再在local模式下运行出现以下错误: java.lang. ...
Spark SQL -- Hive
使用Saprk SQL 操作Hive的数据前提准备: 1.启动Hdfs,hive的数据存储在hdfs中; 2.启动hive -service metastore,元数据存储在远端,可以远程访问; 3 ...
spark sql/hive小文件问题
针对hive on mapreduce 1:我们可以通过一些配置项来使Hive在执行结束后对结果文件进行合并: 参数详细内容可参考官网:https://cwiki.apache.org/conflue ...
小记---------spark组件与其他组件的比较 spark/mapreduce ;spark sql/hive ; spark streaming/storm
Spark与Hadoop的对比 Scala是Spark的主要编程语言,但Spark还支持Java.Python.R作为编程语言 Hadoop的编程语言是Java
Spark记录-org.apache.spark.sql.hive.HiveContext与org.apache.spark.sql.SQLContext包api分析
HiveContext/SQLContext val hiveContext=new HiveContext(new SparkContext(new SparkConf().setAppName(& ...
Error while instantiating 'org.apache.spark.sql.hive.HiveSessionStateBuilder': —— windows 开发环境使用spark 无法访问hdfs 问题解决
## 错误: ## 解决方案: 下载 hadoop 的可执行tar包,解压放在windows 本地,并配置环境变量. 在解压后的文件夹的bin目录下放入两个文件: winutils.exe, had ...
Spark SQL读取hive数据时报找不到mysql驱动
Exception: Caused by: org.datanucleus.exceptions.NucleusException: Attempt to invoke the "BoneC ...
spark SQL学习（spark连接hive）
spark 读取hive中的数据 scala> import org.apache.spark.sql.hive.HiveContext import org.apache.spark.sql. ...

随机推荐

基于VUE2.0的分页插件（很好用，很简单）
基于jQuery的分页插件很多,今天分享一下基于Vue的分页插件pagination.js,该插件使用用感觉很不错,简单不复杂,现将个人使用过程中的方法与遇到的问题以及实例分享出来. 下载解压的主要目 ...
OK335xS CAN device register and deiver match hacking
/************************************************************************* * OK335xS CAN device regi ...
mysql完整版
mysql: dbs 数据库系统 bdms 数据库管理系统 bda 数据库管理员 db 数据库 dba通过dbms来操作db! 关系型数据库和非关系型数据库登录mysql mysql -h主机地址 ...
租酥雨的NOIP2018赛前日记
租酥雨的NOIP2018赛前日记离$\mbox{NOIP2018}$只剩下不到一个月的时间辣! 想想自己再过一个月就要退役了,觉得有必要把这段时间的一些计划与安排记录下来. 就从国庆收假开始吧. ...
test20181006 石头剪刀布
题意分析考场做法同题解一样. std代码. #include<bits/stdc++.h> using namespace std; template <typename T&g ...
ACM常用算法
数据结构栈,队列,链表哈希表,哈希数组堆,优先队列双端队列可并堆左偏堆二叉查找树 Treap 伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维 ...
手把手图文教你eclipse下如何配置tomcat
很多初学,尤其自学JavaWeb的朋友首次在eclipse下配置tomcat时,总会有种难下手的感觉,在此,笔者通过图文解说的方法,最直观的向大家演示一遍该配置过程,希望对大家有所帮助. 注:本文是建 ...
kettle的输入输出组件和脚本组件
一. 输入组件 1.1表输入从指定的数据库中,通过sql语句来查询数据加载到内存. 允许简易转换:勾选后可以避免不必要的字段的数据类型转换,从而提高性能. 替换sql语句里的变量:勾选后可以通过${ ...
RAII vs. exceptions
析构函数不能抛出异常, 原因析构函数已经变成了异常处理的一部分如果对象出了异常,现在异常处理模块为了维护系统对象数据的一致性,避免资源泄漏,有责任释放这个对象的资源,调用对象的析构函数,可现在假如 ...
UOJ 188 【UR #13】Sanrd——min_25筛
题目:http://uoj.ac/problem/188 令 $ s(n,j)=\sum\limits_{i=1}^{n}[min_i>=p_j]f(j) $ ,其中 $ min_i $ ...

Spark SQL Hive Support Demo

Spark SQL Hive Support Demo的更多相关文章

随机推荐

热门专题