jdbc调用sparksql on yarn

spark sql访问hive表

1.将hive-site.xml拷贝到spark目录下conf文件夹

2.（非必需）将mysql的jar包引入到spark的classpath，方式有如下两种：

方式1：需要在$SPARK_HOME/conf/spark-env.sh中的SPARK_CLASSPATH添加jdbc驱动的jar包

export SPARK_CLASSPATH=$SPARK_CLASSPATH:/usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

方式2：在spark-sql命令中指定driver-class-path，如

local模式

spark-sql --driver-class-path /usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

集群模式：

spark-sql --master yarn --driver-class-path /usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

开启HiverServer2

默认模式为yarn-client,HiverServer作为一个yarn的应用运行，如图：

![在这里插入图片描述](https://img-blog.csdnimg.cn/20181127144348670.png

内网连接：

sbin/start-thriftserver.sh --master yarn --driver-class-path /usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

外网连接：

sbin/start-thriftserver.sh --hiveconf hive.server2.thrift.port=10000 --hiveconf hive.server2.thrift.bind.host=hadoop-master --master yarn --driver-class-path /usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

如果指定yarn-cluster模式会报错：

停止thriftserver

sbin/stop-thriftserver.sh

beeline客户端访问thrift server

通过-n指定sql以那个用户执行,下面两个ip是hadoop-master的内外网地址

beeline -u jdbc:hive2://10.9.2.100:10000 -n hive --hiveconf mapreduce.job.queuename=mxbs

beeline -u jdbc:hive2://122.23.368.32:10000 -n hive --hiveconf mapreduce.job.queuename=mxbs

java样例程序

import java.sql.*;

import java.util.HashSet;

import java.util.Set;

public class SimpleDemo1 {

    private final static Set<String> HIVE_CONFIGS = initConfig();

    /**

     * hive conf设置

     *

     * @return

     */

    private static Set<String> initConfig() {

        Set<String> configs = new HashSet<String>();

        configs.add("set mapreduce.job.queuename=queue1");

        configs.add("set hive.cli.print.header=false");

        return configs;

    }

    /**

     * 临时去掉所有错误处理和资源关闭

     * @param args

     * @throws ClassNotFoundException

     * @throws SQLException

     */

    public static void main(String[] args) throws ClassNotFoundException, SQLException {

        String jdbcdriver = "org.apache.hive.jdbc.HiveDriver";

        String jdbcurl = "jdbc:hive2://127.0.0.1:10000";

        String username = "user001";

        String password = "";

        Connection conn = null;

        Statement statement = null;

        Class.forName(jdbcdriver);

        DriverManager.setLoginTimeout(20);

        conn = DriverManager.getConnection(jdbcurl, username, password);

        statement = conn.createStatement();

        for (String config : HIVE_CONFIGS) {

            statement.execute(config);

        }

        String sql = "select * from db1.test limit 10";

        print(statement.executeQuery(sql));

    }

}

maven引用：

<hadoop.version>2.6.0-cdh5.13.0</hadoop.version>

<hive-jdbc.version>1.1.0</hive-jdbc.version>        

<dependency>

    <groupId>org.apache.hive</groupId>

    <artifactId>hive-jdbc</artifactId>

    <version>${hive-jdbc.version}</version>

</dependency>

<dependency>

    <groupId>org.apache.hadoop</groupId>

    <artifactId>hadoop-common</artifactId>

    <version>${hadoop.version}</version>

</dependency>

jdbc调用sparksql on yarn的更多相关文章

jdbc调用sparksql
将hive-site.xml拷贝到spark目录下conf文件夹 local模式 spark-sql --driver-class-path /usr/local/hive-1.2.1/lib/mys ...
Java数据库连接——JDBC调用存储过程,事务管理和高级应用
一.JDBC常用的API深入详解及存储过程的调用相关链接:Jdbc调用存储过程 1.存储过程(Stored Procedure)的介绍我们常用的操作数据库语言SQL语句在执行的时候需要先编译,然后 ...
使用 JDBC 调用函数 & 存储过程
/** * 如何使用 JDBC 调用存储在数据库中的函数或存储过程 */ @Test public void testCallableStatment() { Connection connectio ...
shell脚本调用spark-sql
为了更方便的查询并产生报表, 需要使用shell脚本调用spark-sql spark/bin/spark-sql --master spark://host:7077 -f ${SQL_FILE} ...
jdbc调用存储过程的方法
----------------------------jdbc调用存储过程的方法---------------------------------------------------private ...
使用JDBC调用数据库的存储过程
本篇讲述如何使用JDBC来调用MySQL数据库中的存储过程.建议在学习如何使用JDBC调用存储过程前,请先了解如何在数据库中使用存储过程. 存储过程是指在数据库系统中,一组为了完成特定功能的SQL语句 ...
JDBC调用存储过程
一. JDBC调用存储过程 (1)使用存储过程SQL编写的程序代码,等一段语句和控制流语句.在创建时被编译成机器代码和存储在数据库中的client转让. 存储过程具有以下优势: 1.所生成的机器代码被 ...
Java数据库连接--JDBC调用存储过程，事务管理和高级应用
相关链接:Jdbc调用存储过程一.JDBC常用的API深入详解及存储过程的调用 1.存储过程的介绍我们常用的操作数据库语言SQL语句在执行的时候要先进行编译,然后执行,而存储过程是在大型数据库系统 ...
JDBC调用存储过程的例子
下面是我学到了Oracle存储过程,在这里跟大家简单的分享一下利用JDBC调用存储过程的例子: 废话就不啰嗦,现在就直接上机代码. 首先我利用的是Oracle中默认的 scott 数据库里的 emp员 ...

随机推荐

CDN推送
一.什么是CDN推送当后端服务器中的DNS有更新的时候,在varnish的缓存中应该及时地同步后端服务器中的内容.相当于清空varnish中的缓存,当下一次进行访问时,直接从服务器中获取新的内容. ...
webpack 事件触发按需加载
比较易懂, 方法简单 var util_sync = require('./util-sync.js') alert(util_sync.data) document.getElementById(& ...
java项目添加到Tomcat中运行-(项目转换为Dynamic Web Project)
当在eclipse中建了一个java project项目希望他运行在Tomcat中时: 在项目上右键单击,选择 Properties: 在左侧选择 Project Facets,单击右侧的 ”Conv ...
EasyDarwin如何支持点播和RTMP/HLS直播？EasyDSS！
2017年很长很长一段时间没有更新EasyDarwin开源项目了,虽然心里有很多EasyDarwin功能扩展的计划:比如同步录像.同步RTMP/HLS直播输出.拉模式转发优化.Onvif接入.GB28 ...
Openstack认证过程
01.登陆界面或命令行通过RESTful API向Keystone获取认证信息: 02.Keystone通过用户请求认证信息,并生成auth-token返回给对应的认证请求: 03.界面或命令行通过R ...
caffe 细节
batch :http://www.zhihu.com/question/32673260 caffe blog: http://blog.csdn.net/abcjennifer/article/d ...
【剑指offer-21】调整数组顺序使奇数位于偶数前面，C++实现（冒泡排序）
1.题目输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分. 2.思路本题有两种解法,一种是不保证数组稳定性的解法,一种是保 ...
MySQL INFORMATION_SCHEMA 使用
--查看创建的索引的CARDINALITY比率 --通常cardinality达到表数据的10%左右建索引会有意义--如果是一个组合索引,索引第一位的cardinality表示第一个列的cardina ...
关于python机器学习常用算法的例子
Home Installation Documentation Examples Previous An introduction ... This documentation is for ...
[转]blocks编程
原文地址:http://geeklu.com/2012/01/block/ 介绍声明创建和调用 Block和变量 Block实际应用 1.介绍 Block是一个C Level的语法以及运行时的一个特 ...

jdbc调用sparksql on yarn

jdbc调用sparksql on yarn的更多相关文章

随机推荐

热门专题