spark操作hive方式(scala)

第一种方式:

def operatorHive: Unit = {

    Class.forName("org.apache.hive.jdbc.HiveDriver")

    val url = "jdbc:hive2://192.168.2.xxx:10000"

    val connection: Connection = DriverManager.getConnection(url, "root", "diagbotkwz@123")

    val createStatement: Statement = connection.createStatement()

    val query: ResultSet = createStatement.executeQuery("select * from diagbot.ord_lis_trend limit 2")

    while (query.next()) {

      println(query.getString(1))

    }

  }

第二种方式:

object SparkOperaterHive {

  val sparkConf: SparkConf = new SparkConf().setAppName(SparkOperaterHive.getClass.getSimpleName)

  val sparkSession: SparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport().getOrCreate()

  val sc: SparkContext = sparkSession.sparkContext

  val sqlContext: SQLContext = sparkSession.sqlContext

  def main(args: Array[String]) {

    import sparkSession.implicits._

    val sql1: DataFrame = sparkSession.sql("select * from janggan.diagnosismedication")

    val properties: Properties = new Properties()

    properties.put("user", "root")

    properties.put("password", "diagbot@20180822")

    properties.put("driver", "com.mysql.jdbc.Driver")

    //    sql1.write.mode(SaveMode.Append).jdbc(url,"doc_info_hive",properties)

    println("总数为:" + sql1.count())

    println("sddhdj" + sql1.columns(1))

    sparkSession.stop()

  }

}

spark操作hive方式(scala)的更多相关文章

Spark之使用SparkSql操作Hive的Scala程序实现
依赖 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-hive_2 ...
Spark 操作Hive 流程
1.ubuntu 装mysql 2.进入mysql: 3.mysql>create database hive (这个将来是存你在Hive中建的数据库以及表的信息的(也就是元数据))mysql ...
spark 操作Hive时遇到的问题
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).17/10/14 ...
Docker搭建大数据集群 Hadoop Spark HBase Hive Zookeeper Scala
Docker搭建大数据集群给出一个完全分布式hadoop+spark集群搭建完整文档,从环境准备(包括机器名,ip映射步骤,ssh免密,Java等)开始,包括zookeeper,hadoop,hiv ...
spark 操作hive
1.hive动态分区,只需进行以下设置 val spark = SparkSession.builder() .appName("hivetest") .master(" ...
spark SQL学习（spark连接hive）
spark 读取hive中的数据 scala> import org.apache.spark.sql.hive.HiveContext import org.apache.spark.sql. ...
大数据学习day25------spark08-----1. 读取数据库的形式创建DataFrame 2. Parquet格式的数据源 3. Orc格式的数据源 4.spark_sql整合hive 5.在IDEA中编写spark程序（用来操作hive） 6. SQL风格和DSL风格以及RDD的形式计算连续登陆三天的用户
1. 读取数据库的形式创建DataFrame DataFrameFromJDBC object DataFrameFromJDBC { def main(args: Array[String]): U ...
数仓Hive和分布式计算引擎Spark多整合方式实战和调优方向
@ 目录概述 Spark on Hive Hive on Spark 概述编译Spark源码配置调优思路编程方向分组聚合优化 join优化数据倾斜任务并行度小文件合并 CBO 谓词下 ...
Spark&Hive：如何使用scala开发spark访问hive作业，如何使用yarn resourcemanager。
背景: 接到任务,需要在一个一天数据量在460亿条记录的hive表中,筛选出某些host为特定的值时才解析该条记录的http_content中的经纬度: 解析规则譬如: 需要解析host: api.m ...

随机推荐

Spring+SpringMVC+Mybatis(SSM)框架集成搭建
Spring+SpringMVC+Mybatis框架集成搭建教程一.背景最近有很多同学由于没有过SSM(Spring+SpringMvc+Mybatis , 以下简称SSM)框架的搭建的经历,所以 ...
随记sqlserver学习笔记
create database libraryDBgouse libraryDBgo--读者信息表create table ReaderInfo( ReaderId int not null prim ...
Python中遍历整个列表及注意点（参考书籍Python编程从入门到实践）
1. 利用for循环遍历整个列表 magicians = ['alice', 'dsvid', 'carolina'] # 遍历整个列表 for magician in magicians: prin ...
Python【常用的数据类型】
int, float, string整数,浮点数,字符串----------------------------------------字符串(string)用引号括起来的文本 >>& ...
基于openfire的IM即时通讯软件开发
openfire:http://www.igniterealtime.org/ Xmpp:http://xmpp.org/ IOS(xmppframework):https://github.com/ ...
v8 引擎的内存
一.nodejs查看内容使用情况: process.memoryUsage() 单位为 Btye 转化函数: var format = function(bytes) { return (bytes/ ...
题解-AtCoder ARC-083F Collecting Balls
Problem ARC083F 题意概要:给定 \(2n\) 个二维平面上的球,坐标分别为 \((x_i,y_i)\),并给出 \(n\) 个 \(A\)类机器人和 \(n\) 个 \(B\)类 ...
Effective Java 读书笔记（四）：泛型
1 不要使用原始类型 (1)术语术语例子参数化类型(Parameterized type) List<String> 实际类型参数(Actual type parameter) St ...
"多层感知器"--MLP神经网络算法
提到人工智能(Artificial Intelligence,AI),大家都不会陌生,在现今行业领起风潮,各行各业无不趋之若鹜,作为技术使用者,到底什么是AI,我们要有自己的理解. 目前,在人工智能中 ...
C#合并选中EXCEL中的各个工作表
合并选中EXCEL中的各个工作表,以第一个选中的EXCEL文件里的工作表进行匹配,遍历后面的每个EXCEL文件,有相同的工作表就合并: private void button1_Click(objec ...

spark操作hive方式(scala)

spark操作hive方式(scala)的更多相关文章

随机推荐

热门专题