Spark源码编译，官网学习

这里以spark-1.6.0版本为例

官网网址 http://spark.apache.org/docs/1.6.0/building-spark.html#building-with-buildmvn

前提：使用Maven构建Spark需要Maven 3.3.3或更新版本和Java 7以上版本。

Spark构建可以提供合适的Maven二进制文件; 见下文。

1.用build/mvn 进行构建spark

Spark现在包含一个独用的Maven安装，以便轻松地从本地源码的build/目录下构建和部署Spark。此脚本将自动下载并设置所有必需的构建要求（Maven，Scala和Zinc）在本身的build /目录里。如果已经存在任何mvn二进制文件，它将会被授予，否则将自动下载Scala和Zinc副本，确保正确的版本要求得到满足。 build / mvn执行作为一个传递到mvn调用，允许从以前的构建方法轻松转换。例如，可以如下构建Spark的版本：

build/mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4. -DskipTests clean package

这种方法没有测试，只看了官网的介绍，有兴趣大家可以自己测试一下。

2.make-distribution.sh 方式

要创建Spark分布，就像由Spark Downloads页面分发的那样，并且被布局为可运行，可以使用项目根目录中的make-distribution.sh。它可以配置Maven配置文件设置等等直接的Maven构建。例：

./make-distribution.sh --name custom-spark --tgz -Psparkr -Phadoop-2.4 -Phive -Phive-thriftserver -Pyarn

对于这个指令的更多的使用信息，可以help查看

./make-distribution.sh --help

这种方式没有测试，依旧只看了官网的介绍，有兴趣大家可以自己测试一下

3.maven进行构建spark

Spark源码编译，官网学习的更多相关文章

[转]OpenTK学习笔记(1)-源码、官网地址
OpenTK源码下载地址:https://github.com/opentk/opentk OpenTK使用Nuget安装命令:OpenTK:Install-Package OpenTK -Versi ...
Spark源码编译
原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/3822995.html spark源码编译步骤如下: cd /home/hdpusr/workspace ...
spark源码编译记录
spark在项目中已经用了一段时间了,趁现在空闲,下个源码编译在IDEA里面阅读下,特此记录过程. 前提已经安装maven和git 1.上官网下载源码的包: 2.然后解压到一个文件夹 3.编译,编译的 ...
Spark源码编译并在YARN上运行WordCount实例
在学习一门新语言时,想必我们都是"Hello World"程序开始,类似地,分布式计算框架的一个典型实例就是WordCount程序,接触过Hadoop的人肯定都知道用MapRedu ...
Apache Spark源码走读之9 -- Spark源码编译
欢迎转载,转载请注明出处,徽沪一郎. 概要本来源码编译没有什么可说的,对于java项目来说,只要会点maven或ant的简单命令,依葫芦画瓢,一下子就ok了.但到了Spark上面,事情似乎不这么简单 ...
Spark源码编译（未完待续）
在这里我们不需要搭建独立的Spark集群,利用Yarn Client调用Hadoop集群的计算资源. Spark源码编译生成配置包: 解压源码,在根去根目录下执行以下命令(sbt编译我没尝试) ./m ...
OpenTK学习笔记(1)-源码、官网地址
OpenTK源码下载地址:https://github.com/opentk/opentk OpenTK使用Nuget安装命令:OpenTK:Install-Package OpenTK -Versi ...
【源码编译】spark源码编译
本文采用cdh版本spark-1.6.0-cdh5.12.0 1.源码包下载 2.进入根目录编译,编译的方式有2种 maven mvn clean package \ -DskipTests -Pha ...
spark源码编译，运行example遇到：NoClassDefFoundError: org/spark_project/guava/cache/CacheLoader
基本环境: win10+idea Scala2.11.8 maven3.5.3 spark2.1.0 问题: 在window10下编译spark2.1.0源码,在idea下运行example,遇到问题 ...

随机推荐

ES5-ES6-ES7_async函数
async 函数概述 async/await应该是目前最简单的异步方案,ES7 中新增了 async/await 两个关键词. async 可以声明一个异步函数,此函数需要返回一个 Promise 对 ...
python获取数据网页数据并创建文件夹保存（基于python3.6）
from urllib.parse import urljoin import urllib.request from bs4 import BeautifulSoup import os impor ...
思考与算法：大脑是cpu、思考是算法
思考与算法:大脑是cpu.思考是算法
Python入门学习：1.变量和简单的数据类型
python入门学习:1.变量和简单的数据类型关键点:变量.字符串.数字 1.1 变量的命名和使用1.2 字符串1.3 数字1.4 注释 1.1 变量的命名和使用变量,顾名思义是一个可变的量, ...
ASP.NET API Helper Page 创建并生成相关帮助文档
创建API项目修改原工程文件,该行为是为了避免和引入第三方API工程文件冲突修改发布设置引入需要生成文档的相关文件,将第三方API依赖的相关文件(XML文件非常重要,是注释显示的关键),复制到文 ...
maven 标签classifier 研究一下
研究一下maven的标签: <dependency> <groupId>io.netty</groupId> <artifactId>netty-tcn ...
Python：Day48 Jquery
引用方式: <script src="jquery-3.3.1.js"></script> jQuery就是一个jQuery对象,可以简写成$ 基本语法:$ ...
Mqtt用户认证
http://emqtt.com/docs/v2/guide.html 1默认是匿名认证,不用输入用户名和密码,直接可连接 2如何开启用户名和密码认证模式 2-1关闭匿名认证在你的MQTT安装目录下 ...
Java多线程（五）——线程等待与唤醒
一.wait().notify().notifyAll()等方法介绍在Object.java中,定义了wait(), notify()和notifyAll()等接口.wait()的作用是让当前线程进 ...
Docker网络和容器的通信
Docker的本地网络实现其实就是利用了Linux上的网络命名空间和虚拟网络设备(特别是veth pair). 基本原理直观上看,要实现网络通信,机器需要至少一个网络接口(物理接口或虚拟接口)与外界 ...

Spark源码编译，官网学习

Spark源码编译，官网学习的更多相关文章

随机推荐

热门专题