通过thriftserver的beeline/jdbc等方式连接到SparkSQL

thriftserver和beeline的简单配置和使用
启动thriftserver: 默认端口是10000 ，可以修改
$ ./${SPARK_HOME}/sbin/start-thriftserver.sh --master local[2] --jars ~/software/mysql-connector-java-5.1.27-bin.jar
同样需要通过 --jars 传入mysql驱动
启动beeline

beeline -u jdbc:hive2://localhost:10000 -n hadoop

hadoop为用户名端口和前面保持一致

修改thriftserver启动占用的默认端口号：

./start-thriftserver.sh  \

--master local[] \

--jars ~/software/mysql-connector-java-5.1.-bin.jar  \

--hiveconf hive.server2.thrift.port=

连接14000上的thriftserver

beeline -u jdbc:hive2://localhost:14000 -n hadoop

thriftserver和普通的spark-shell/spark-sql有什么区别？
使用thriftserver后，spark-shell、spark-sql都是一个spark application；
使用thriftserver后，不管你启动多少个客户端(beeline/code)，永远都是一个spark application，解决了一个数据共享的问题，多个客户端可以共享数据。
使用jdbc的方式连接
首先需要在pom.xml文件中添加hive-jdbc的依赖

   <!--添加hive-jdbc依赖-->

        <dependency>

            <groupId>org.spark-project.hive</groupId>

            <artifactId>hive-jdbc</artifactId>

            <version>1.2.</version>

        </dependency>

1.开发示例代码，这里假设已经启动了thriftserver的14000端口

简单测试 try catch就不写了

import java.sql.DriverManager

/**

  * @Description: 使用JDBC的连接sparkSQL

  */

object SparkSQLThriftServerApp {

  def main(args: Array[String]): Unit = {

    Class.forName("org.apache.hive.jdbc.HiveDriver")

    val conn = DriverManager.getConnection("jdbc:hive2://localhost:14000","xiangcong","")

    val pstmt = conn.prepareStatement("select empno, ename, sal from emp")

    val rs = pstmt.executeQuery()

    while (rs.next()) {

      println("empno:" + rs.getInt("empno") +

        " , ename:" + rs.getString("ename") +

        " , sal:" + rs.getDouble("sal"))

    }

    rs.close()

    pstmt.close()

    conn.close()

  }

}

通过thriftserver的beeline/jdbc等方式连接到SparkSQL的更多相关文章

Spark Sql之ThriftServer和Beeline的使用
概述 ThriftServer相当于service层,而ThriftServer通过Beeline来连接数据库.客户端用于连接JDBC的Server的一个工具步骤 1:启动metastore服务 . ...
Hive HiveServer2+beeline+jdbc客户端访问操作
HiveServer 查看/home/hadoop/bigdatasoftware/apache-hive-0.13.1-bin/bin目录文件,其中有hiveserver2 启动hiveserver ...
3.1 HiveServer2.Beeline JDBC使用
https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients 一.HiveServer2.Beeline 1.HiveSer ...
Hadoop Hive概念学习系列之hive里的扩展接口（CLI、Beeline、JDBC）（十六）
<Spark最佳实战陈欢>写的这本书,关于此知识点,非常好,在94页. hive里的扩展接口,主要包括CLI(控制命令行接口).Beeline和JDBC等方式访问Hive. CLI和B ...
Hive Beeline 命令行参数
[hadoop@hive ~]$ beeline --help[中文版] The Beeline CLI 支持以下命令行参数: Option Description --autoCommit=[tru ...
Spark入门实战系列--6.SparkSQL（上）--SparkSQL简介
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .SparkSQL的发展历程 1.1 Hive and Shark SparkSQL的前身是 ...
sparkSQL1.1入门
http://blog.csdn.net/book_mmicky/article/details/39288715 2014年9月11日,Spark1.1.0忽然之间发布.笔者立即下载.编译.部署了S ...
Hive 学习笔记（启动方式，内置服务）
一.Hive介绍 Hive是基于Hadoop的一个数据仓库,Hive能够将SQL语句转化为MapReduce任务进行运行. Hive架构图分为以下四部分. 1.用户接口 Hive有三个用户接口: 命令 ...
Spark SQL笔记
HDFS HDFS架构 1.Master(NameNode/NN) 对应 N个Slaves(DataNode/NN)2.一个文件会被拆分成多个块(Block)默认:128M例: 130M ==> ...

随机推荐

在 Ubuntu 14.04 服务器上部署 Hexo 博客
版权声明:本文由宋秉金原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/241080001487926962 来源:腾云阁 ...
ansj分词原理
ansj第一步会进行原子切分和全切分,并且是在同时进行的.所谓原子,是指短句中不可分割的最小语素单位.例如,一个汉字就是一个原子.全切分,就是把一句话中的所有词都找出来,只要是字典中有的就找出来.例如 ...
[原]jenkins(六)---jenkins远程部署脚本
/** * lihaibo * 文章内容都是根据自己工作情况实践得出. * 版权声明:本博客欢迎转发,但请保留原作者信息! http://www.cnblogs.com/horizonli/p/533 ...
[原]Jenkins(十二)---jenkins管理员用户无法登陆解决办法Access Denied
/** * lihaibo * 文章内容都是根据自己工作情况实践得出. *如有错误,请指正 * 版权声明:本博客欢迎转发,但请保留原作者信息! http://www.cnblogs.com/horiz ...
关于linux下mysql 5.7.x数据库的yum的安装方法
环境介绍>>>>>>>>>>>>>>>>>> 操作系统:Centos 7.1 mysql数据 ...
Atom与markdown
简述 Atom是github开发的开源跨平台的编辑器,Atom的强大可以与大名鼎鼎的Sublime Text相媲美.因为使用过Sublime Text,所以用Atom上手很快.这篇文章主要介绍使用At ...
cordova 企业应用打包Archive的时候报 "#import <Cordova file not found"
可能原因是Cordova的路径问题: For xcode7 add "$(OBJROOT)/UninstalledProducts/$(PLATFORM_NAME)/include" ...
Java：对double值进行四舍五入，保留两位小数的几种方法
1. 功能将程序中的double值精确到小数点后两位.可以四舍五入,也可以直接截断. 比如:输入12345.6789,输出可以是12345.68也可以是12345.67.至于是否需要四舍五入,可以通 ...
C语言迷题：有符号数与无符号数的问题（转）
https://my.oschina.net/kelvinfang/blog/134725
常用Common集合
Log using System; using System.IO; using System.Linq; using System.Text; namespace Common { public c ...

通过thriftserver的beeline/jdbc等方式连接到SparkSQL

通过thriftserver的beeline/jdbc等方式连接到SparkSQL的更多相关文章

随机推荐

热门专题