Scala_Load csv data to hive via spark2.1

prepare csv:

# vim /tmp/cars.csv

year,make,model,comment,blank

"","Tesla","S","No comment",

"","Ford,E350","Go get one now they are going fast",

"","Chevy","Volt"

scala code:

package com.liupu

import org.apache.spark.{ SparkContext, SparkConf }

import org.apache.spark.sql.hive.HiveContext

import org.apache.spark.sql.hive.orc._

object LoadCsvParams {

  def main(args: Array[String]) {

    var sourceCsvPath = args()

    var targetPath = args()

    var hiveTableName = args()

    var sc = new SparkContext()

    val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)

    val df = hiveContext.read

      .format("com.databricks.spark.csv")

      .option("header", "true")

      .option("inferSchema", "true")

      .load(sourceCsvPath)

    val selectedData = df.select("year", "model")

    selectedData.write.format("orc").option("header", "true").save(targetPath)

    hiveContext.sql(s"create external table $hiveTableName(year int,model string) stored as orc location '$targetPath'")

    hiveContext.sql("show tables").collect().foreach(println)

    sc.stop()

  }

}

spark submit:

./spark-submit \

--class com.liupu.LoadCsvParams \

--master local[*] \

/home/pl62716/scalaTest.jar \

"/tmp/cars.csv" "/tmp/hive_cars2" "hive_cars2" "/tmp/hive_cars2"

Scala_Load csv data to hive via spark2.1_via pass parameters的更多相关文章

Scala_Load csv data to hive via spark2.1_via pass parameters_HiveAllType
prepare CSV data NT,col_SMALLINT,col_BIGINT,col_INT,col_FLOAT,col_DOUBLE,col_DECIMAL,col_TIMESTAMP,c ...
Scala_Load csv data to hive via spark2.1
code: package com.liupu import org.apache.spark.{ SparkContext, SparkConf } import org.apache.spark. ...
JMeter学习-010-JMeter 配置元件实例之 - CSV Data Set Config 参数化配置
众所周知,在进行接口测试的过程中,需要创建不同的场景(不同条件的输入,来验证不同的入参的返回结果).因而,在日常的自动化接口监控或商品监控等线上监控过程中,需要配置大量的入参来监控接口的返回是否正确. ...
Jmeter—6 CSV Data Set Config 通过文件导入数据
线程组循环次数大于1的时候,请求里每次提交的数据都相同.有的系统限制了不能提交相同数据,我们通过 CSV Data Set Config 加载csv文件数据. 1 创建一个文本文件,输入参数值保存为. ...
Jmeter组件1. CSV Data Set Config
位置:Test Plan | Add | Config Element | CSV Data Set Config 意义: 脚本参数化节省CPU跟内存(可以准备好数据文件去代替动态生成数据,节约CP ...
JMeter脚本参数化和断言设置（ CSV Data Set Config ）
用Badboy录制了Jmeter的脚本,用Jmeter打开后形成了原始的脚本.但是在实际应用中,为了增强脚本的多样性,就要使脚本参数化.这里我以登录为例,参数化用户账号与用户密码. 图1 :原始脚本 ...
jmeter参数化之CSV Data Set Config
在jmeter中,可以用CSV Data Set Config实现参数化. 1.准备参数化数据
转：Jmeter之使用CSV Data Set Config实现参数化登录
在使用Jemeter做压力测试的时候,往往需要参数化用户名,密码以到达到多用户使用不同的用户名密码登录的目的.这个时候我们就可以使用CSV Data Set Config实现参数化登录: 首先通过Te ...
转：CSV Data Set Config 中文乱码问题
从csv读取中文一直乱码. CSV Data Set Config的File encoding为GB2312,对应参数化文件编码也为GB2312,但读取出变量值一直为乱码,后发现是Allow quot ...

随机推荐

浅谈双流水线调度问题以及Jhonson算法
引入:何为流水线问题有\(n\)个任务,对于每个任务有\(m\)道工序,每个任务的\(m\)道工序必须在不同的m台机器上依次完成才算把这个任务完成,在前\(i-1\)道工序完成后才能去完成第\(i\ ...
BZOJ5443：[CEOI2018]Lottery
我对状态空间的理解:https://www.cnblogs.com/AKMer/p/9622590.html 题目传送门:https://www.lydsy.com/JudgeOnline/probl ...
EF中调整字段的顺序
EF中设计数据库表结构时,在Designer UI中无法调整添加好的字段顺序. 方法: 1.在Solution Explorer中右击XXX.edmx文件, 选择"Open With&quo ...
百度地图设置div样式宽高为百分比不显示地图
如题,不显示地图只要在样式代码里面加以 position:absolute; 代码就可以了 <style type="text/css"> body, html,#al ...
Date---String is 合法的date 方法---
package com.etc.jichu; import java.text.SimpleDateFormat; public class IsDate { public static boolea ...
js检测对象属性
In:(检测自身及原型属性) var o={x:1}; "x" in o; //true,自有属性存在 "y" in o; //false "toSt ...
linux普通用户home目录锁定
JavaScript之JMap
在JavaScript中我们利用function类定义类在类的内部我们用var 定义私有变量私有函数在类的内部我们用this 定义公有变量(1)定义一个类 function JMap() { var ...
Python，PyCharm2017安装教程，包含注册码[转载]
一,安装PyCharm 1.下载PyCharm 进入https://www.jetbrains.com/pycharm/download/#section=windows官网下载页面,可以到到PyCh ...
Java接口定义和实现
1. 使用interface来定义一个接口.接口定义类似类的定义,分为接口的声明和接口体,其中接口体由常量定义和方法定义两部分组成.定义接口的基本格式如下: [修饰符] interface 接口名 [ ...

Scala_Load csv data to hive via spark2.1_via pass parameters

Scala_Load csv data to hive via spark2.1_via pass parameters的更多相关文章

随机推荐

热门专题