spark-submit的使用shell时时灵活性较低，livy作为spark提交的一种工具，是使用接口或者java客户端的方式提交，可以集成到web应用中

1.客户端提交的方式

http://livy.incubator.apache.org/docs/latest/programmatic-api.html

核心代码

LivyClient client = new LivyClientBuilder()

  .setURI(new URI(livyUrl))

  .build();

try {

  System.err.printf("Uploading %s to the Spark context...\n", piJar);

  client.uploadJar(new File(piJar)).get();

  System.err.printf("Running PiJob with %d samples...\n", samples);

  double pi = client.submit(new PiJob(samples)).get();

  System.out.println("Pi is roughly: " + pi);

} finally {

  client.stop(true);

}

2.REST API

http://livy.incubator.apache.org/docs/latest/rest-api.html

1.以最常使用的batches接口作为例子,请求参数

rest 的http

import org.apache.http.HttpEntity;

import org.apache.http.HttpResponse;

import org.apache.http.client.methods.HttpDelete;

import org.apache.http.client.methods.HttpGet;

import org.apache.http.client.methods.HttpPost;

import org.apache.http.entity.StringEntity;

import org.apache.http.impl.client.CloseableHttpClient;

import org.apache.http.impl.client.HttpClients;

import org.apache.http.util.EntityUtils;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

public class HttpUtils {

//post 请求

 public  String postAccess(String url, Map<String, String> headers, String data) {

        HttpPost post = new HttpPost(url);

        if (headers != null && headers.size() > 0) {

            headers.forEach((K, V) -> post.addHeader(K, V));

        }

        try {

            StringEntity entity = new StringEntity(data);

            entity.setContentEncoding("UTF-8");

            entity.setContentType("application/json");

            post.setEntity(entity);

            HttpResponse response = httpClient.execute(post);

            HttpEntity resultEntity = response.getEntity();

            result = EntityUtils.toString(resultEntity);

            return result;

        } catch (Exception e) {

            e.printStackTrace();

            logger.error("postAccess执行有误" + e.getMessage());

        }

        return result;

    }

}

livy提交spark应用类，异步线程进行状态打印或者也可以状态监控返回web端

import com.alibaba.fastjson.JSON;

import com.alibaba.fastjson.JSONObject;

import com.wanmi.sbc.dw.utils.GsonUtil;

import com.wanmi.sbc.dw.utils.HttpUtils;

import lombok.SneakyThrows;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

import org.springframework.beans.BeanUtils;

import org.springframework.stereotype.Component;

import java.io.IOException;

import java.util.Arrays;

import java.util.HashMap;

import java.util.List;

/**

 * @ClassName: com.spark.submit.impl.livy.LivyApp

 * @Description: livy提交spark任务

 * @Author: 小何

 * @Time: 2020/12/15 10:46

 * @Version: 1.0

 */

@Component

public class LivyServer {

    private static final Logger logger = LoggerFactory.getLogger(LivyServer.class);

    private static final List<String> FAIl_STATUS_LIST = Arrays.asList("shutting_down", "error", "dead", "killed");

    private final HashMap<String, String> headers;

    private HttpUtils httpUtils;

    public LivyServer() {

        headers = new HashMap<>();

        headers.put("Content-Type", "application/json");

        headers.put("X-Requested-By", "admin");

    }

    /**

     * 提交参数

     *

     * @param livyParam

     * @return

     */

    @SneakyThrows

    public String batchSubmit(LivyParam livyParam) {

        this.httpUtils = new HttpUtils();

        String livyUri = livyParam.getLivyUri();

        LivyParam livyParamCopy = new LivyParam();

        BeanUtils.copyProperties(livyParam, livyParamCopy);

        livyParamCopy.setLivyUri(null);

        String request = GsonUtil.toJsonString(livyParamCopy);

        logger.info("任务提交信息{}", request);

        String result = httpUtils.postAccess(livyUri + "/batches", headers, request);

        if (!GsonUtil.isJson(result)) {

            logger.info("任务提交错误:{}", result);

            return "error:" + result;

        }

        if (result == null) {

            return "error:" + "livy地址:" + livyUri + "错误,请检查";

        }

        logger.info("提交返回任务返回信息:{}", result);

        JSONObject jsonObject = JSONObject.parseObject(result);

        String state = jsonObject.getString("state");

        String id = jsonObject.getString("id");

        Thread thread = new Thread(() -> {

            try {

                queryState(livyParam.getLivyUri(), id, state);

            } catch (InterruptedException | IOException e) {

                logger.error("线程运行出错:{}", e.fillInStackTrace());

            }

        }, livyParam.getName() + System.currentTimeMillis());

        thread.start();

        return result;

    }

    //提交任务执行状态验证

    public void queryState(String livyUrl, String batchId, String responseState) throws InterruptedException, IOException {

        if (responseState != null && !FAIl_STATUS_LIST.contains(responseState)) {

            boolean isRunning = true;

            while (isRunning) {

                String url = livyUrl + "/batches/" + batchId;

                String batchesInfo = httpUtils.getAccess(url, headers);

                JSONObject info = JSON.parseObject(batchesInfo);

                String id = info.getString("id");

                String sta = info.getString("state");

                String appId = info.getString("appId");

                String appInfo = info.getString("appInfo");

                logger.info("livy:sessionId:{},state:{}", id, sta);

                if ("success".equals(sta)) {

                    logger.info("任务{}:执行完成", appId, appInfo);

                    httpUtils.close();

                    isRunning = false;

                } else if (FAIl_STATUS_LIST.contains(sta) || sta == null) {

                    logger.error("任务{}执行有误，请检查后重新提交:\n", appId, batchesInfo);

                    httpUtils.close();

                    isRunning = false;

                } else if ("running".equals(sta) || "idle".equals(sta) || "starting".equals(sta)) {

                    logger.info("查看任务{},运行状态:\n{}", appId, batchesInfo);

                } else {

                    logger.info("任务{}状态:{},未知,退出任务查看", id, sta);

                    isRunning = false;

                }

                Thread.sleep(5000);

            }

        }

    }

}

livy请求参数

@Data

public class LivyParam {

    /**

     * livy的地址

     */

    private String livyUri;

    /**

     * 要运行的jar包路径

     */

    private String file;

    /**

     * 运行的代理名

     */

    private String proxyUser;

    /**

     * 运行主类

     */

    private String className;

    /**

     * 主类的参数

     */

        private List<String> args;

    /**

     * 需要运行的jar包

     */

    private String thirdJarPath;

    private List<String> jars;

    private List<String> pyFiles;

    private List<String> files;

    private String driverMemory;

    private Integer driverCores;

    private String executorMemory;

    private Integer executorCores;

    private Integer numExecutors;

    private List<String> archives;

    /**

     * 队列

     */

    private String queue;

    /**

     * appName

     */

    private String name;

    /**

     * 其他配置

     */

    private Map<String, String> conf;

}

测试

      构建参数

        new  livyParam = new LivyParam();

        livyParam.setLivyUri(sparkSubmitParam.getLivyUri());

        livyParam.setClassName(sparkSubmitParam.getClassName());

        livyParam.setArgs(sparkSubmitParam.getArgs());

        livyParam.setConf(sparkSubmitParam.getConf());

        livyParam.setDriverCores(sparkSubmitParam.getDriverCores());

        livyParam.setDriverMemory(sparkSubmitParam.getDriverMemory());

        livyParam.setArchives(sparkSubmitParam.getArchives());

        livyParam.setExecutorCores(sparkSubmitParam.getExecutorCores());

        livyParam.setExecutorMemory(sparkSubmitParam.getExecutorMemory());

        livyParam.setJars(sparkSubmitParam.getJars());

        livyParam.setFile(sparkSubmitParam.getFile());

        livyParam.setName(sparkSubmitParam.getName());

        livyParam.setQueue(sparkSubmitParam.getQueue());

        livyParam.setProxyUser(sparkSubmitParam.getProxyUser());

//发送请求

   String result = liveServer.batchSubmit(livyParam);

livy提交spark应用的更多相关文章

Spark On Yarn：提交Spark应用程序到Yarn
转载自:http://lxw1234.com/archives/2015/07/416.htm 关键字:Spark On Yarn.Spark Yarn Cluster.Spark Yarn Clie ...
如何在Java应用中提交Spark任务？
最近看到有几个Github友关注了Streaming的监控工程--Teddy,所以思来想去还是优化下代码,不能让别人看笑话,是不.于是就想改在一下之前最丑陋的一个地方--任务提交本博客内容基于Spa ...
利用SparkLauncher 类以JAVA API 编程的方式提交Spark job
一.环境说明和使用软件的版本说明: hadoop-version:hadoop-2.9.0.tar.gz spark-version:spark-2.2.0-bin-hadoop2.7.tgz jav ...
【Spark】提交Spark任务-ClassNotFoundException-错误处理
提交Spark任务-ClassNotFoundException-错误处理 Overview - Spark 2.2.0 Documentation Spark Streaming - Spark 2 ...
Spark2.x（五十九）：yarn-cluster模式提交Spark任务，如何关闭client进程?
问题: 最近现场反馈采用yarn-cluster方式提交spark application后,在提交节点机上依然会存在一个yarn的client进程不关闭,又由于spark application都是 ...
Idea里面远程提交spark任务到yarn集群
Idea里面远程提交spark任务到yarn集群 1.本地idea远程提交到yarn集群 2.运行过程中可能会遇到的问题 2.1首先需要把yarn-site.xml,core-site.xml,hdf ...
spark-submit提交spark任务的具体参数配置说明
spark-submit提交spark任务的具体参数配置说明 1.spark提交任务常见的两种模式 2.提交任务时的几个重要参数 3.参数说明 3.1 executor_cores*num_execu ...
提交Spark作业遇到的NoSuchMethodError问题总结
测试应用说明测试的Spark应用实现了同步hive表到kafka的功能.具体处理流程: 从 ETCD 获取 SQL 语句和 Kafka 配置信息使用 SparkSQL 读取 Hive 数据表把 ...
基于Livy的Spark提交平台搭建与开发
为了方便使用Spark的同学提交任务以及加强任务管理等原因,经调研采用Livy比较靠谱,下图大致罗列一下几种提交平台的差别. 本文会以基于mac的单机环境搭建一套Spark+Livy+Hadoop来展 ...

随机推荐

PyQt（Python+Qt）学习随笔：使用pyqtConfigure建立信号和槽的连接
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址在PyQt中,一般信号和槽的连接是通过connect方法建立的,语法如下: connect(slot ...
PyQt(Python+Qt)学习随笔：QAbstractItemView的autoScroll和autoScrollMargin属性
老猿Python博文目录老猿Python博客地址 QAbstractItemView的autoScroll属性用于确认鼠标在视口边缘时是否自动滚动内容,默认值为True,autoScrollMarg ...
JAVA环境安装及其配置
一.JAVA版本的选择我使用的是JAVA8,所以这次方法是JAVA8的安装过程. 这里我给出其下载地址,可以自行下载. 链接: https://pan.baidu.com/s/1k2Xydi6FJ2 ...
小心使用 Task.Run 解惑篇
继上一篇文章之后,这篇文章主要解答以下两个疑惑: 由于值类型是拷贝的方式赋值,所以捕获的本地变量和类成员是指向的是各自的值,对本地变量的捕获不会影响到整个类.但如果把 _id 改为引用类型(如 Str ...
js去除html标签
<script> //替换掉所有的 html标签,得到html标签中的内容 var content = "<p><font color=#000000>没 ...
题解-[国家集训队]Crash的数字表格 / JZPTAB
题解-[国家集训队]Crash的数字表格 / JZPTAB 前置知识: 莫比乌斯反演 </> [国家集训队]Crash的数字表格 / JZPTAB 单组测试数据,给定 \(n,m\) ,求 ...
Element-ui 实现table的合计功能
Element-UI是饿了么前端团队推出的一款基于Vue.js 2.0 的桌面端UI框架,其功能较为完善,根据其文档与demo学习,非常容易上手,但是我在使用其tabel组件时,发现我的功能需求并不 ...
git基础使用(超级详细)
使用git前的步骤: 1. 安装git (安装步骤省略) 2. 使用git设置用户名和邮箱 git config --global user.name "Your Name" gi ...
二、Linux文件系统结构
为了方便管理文件和目录,Linux 系统将它们组织成一个以根目录 / 开始的倒置的树状结构.Linux 中的目录,和 Windows 系统中的文件夹类似,不同之处在于,Linux 系统中的目录也被当做 ...
<UnityTheGreat><001>获取指定目录下指定类型的所有文件的名称
#region Environment Windows 10 Unity 2019.4.16f1c1 LTS VSCode 1.52 https://github.com/MirzkisD1Ex0/U ...

livy提交spark应用

1.客户端提交的方式

2.REST API

rest 的http

livy提交spark应用类，异步线程进行状态打印或者也可以状态监控返回web端

livy请求参数

livy提交spark应用的更多相关文章

随机推荐

热门专题