spark1.2.0编译

spark 有三种编译方式：SBT、MAVEN、make-distribution.sh。SBT、MAVEN两种方式打出来的包比较大，不适合部署使用。因此我们通常使用第三种方式打包。

./make-distribution.sh --tgz --skip-java-test --with-tachyon -Dyarn.version=2.2. -Dhadoop.version=2.2. -Djava.version=1.7 -Dprotobuf.version=2.5. -Pyarn -Phive -Phive-thriftserver

这条命令可以简化为：

./make-distribution.sh --tgz --skip-java-test --with-tachyon -Dhadoop.version=2.2. -Djava.version=1.7 -Dprotobuf.version=2.5. -Pyarn -Phive -Phive-thriftserver

因为yarn的版本用的是hadoop版本变量，即hadoop是什么版本，yarn就是什么版本。

1.使用这种方式不用单独修改maven配置，因为脚本里面会在编译之前执行这条命令

2.--tgz 生成部署包；

3.--skip-java-test 滤过测试阶段；

4.--with-tachyon 感觉tachyon是趋势，所以加上tachyon的支持；

5.-Dhadoop.version 指定hadoop的版本，默认为1.0.4；

6.-Djava.version 指定java版本，默认是1.6；

7.-Dprotobuf.version 指定protobuf的版本，默认是2.4.1；这里指定是因为hadoop使用的2.5.0，不修改的话搭配的时候会出问题；

8.-Pyarn -Phive -Pthriftserver 分别加入yarn、hive的支持。

在根目录下面生成了一个binary包

解压部署包后或者直接在编译过的目录，通过配置conf下的文件，就可以使用spark了

关于编译的时候scala版本问题，我遇到过，它默认的是2.10.4，现在最新的2.11.x，如果不指定直接编译，外部编写scala程序的时候需要引用编译好的jar包，会产生scala版本冲突

但是如果编译的时候指定，就需要注意，如果指定过新的版本，比如

./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.2. -Dhadoop.version=2.2. -Pyarn -Phive -Phive-thriftserver -Dscala-2.11

编译的时候就会出现类似

我也去网上找了，assembly包最新更新到了scala2.10的版本，所以不会编译成功，除非自己再去编译assembly的jar包，比较麻烦

我采取的是降低自己的使用的scala版本，和spark保持一致，反正没什么区别

如果编译的时候指定了--with-tachyon，那么会在出现编译成功后任务不停止，继续下载tachyon的binary包，然后拆解加入即将生成的spark部署包中

spark1.2.0编译的更多相关文章

Apache Spark1.1.0部署与开发环境搭建
Spark是Apache公司推出的一种基于Hadoop Distributed File System(HDFS)的并行计算架构.与MapReduce不同,Spark并不局限于编写map和reduce ...
CentOS 7.0编译安装Nginx1.6.0+MySQL5.6.19+PHP5.5.14
准备篇: CentOS 7.0系统安装配置图解教程 http://www.osyunwei.com/archives/7829.html 一.配置防火墙,开启80端口.3306端口 CentOS 7. ...
centos 7.0 编译安装php 7.0.3
php下载页面 http://cn2.php.net/downloads.php 7.0.3多地区下载页面 http://cn2.php.net/get/php-7.0.3.tar.gz/from/a ...
Valgrind 3.11.0编译安装
Valgrind 3.11.0编译安装 Valgrind是一款用于内存调试.内存泄漏检测以及性能分析的软件开发工具. Valgrind遵守GNU通用公共许可证条款,是一款自由软件. 到3.3.0版本为 ...
基于Spark1.3.0的Spark sql三个核心部分
基于Spark1.3.0的Spark sql三个核心部分: 1.可以架子啊各种结构化数据源(JSON,Hive,and Parquet) 2.可以让你通过SQL,saprk内部程序或者外部攻击,通过标 ...
android5.0 编译
android5.0编译需要jdk1.7版本,将来本地可能需要同时维护两套jdk版本,请参考: 在线安装openjdk1.7 sudo apt-get install openjdk-7-jre op ...
spark1.2.0版本SparkSQL使用parquet类型注意事项
在Spark1.2.0版本中是用parquet存储类型时注意事项: sql语句: select * from order_created_dynamic_partition_parquet; 在spa ...
spark1.2.0安装
standalone 安装SCALA 下载.解压.加入环境变量安装spark1.2.0 下载.解压.加入环境变量 tar zxvf spark--bin-.tgz export SPARK_HOME ...
VC6.0编译boost
今天学习了下VC6.0下boost的编译,只是对regex进行了编译,据说全部编译需要2个多小时,在此记录下学习过程中遇到的问题以便今后查看. 最开始直接从网上(www.boost.org)下载了当前 ...

随机推荐

windows下执行build_native.sh报权限问题
编辑build_native.sh 在前面加上 chmod 777 -R ./*
Vmware虚拟机的网络设置
设置宿主机器的Vmnat8网络适配器. 设置IP地址如图所示设置虚拟机的的网络选择NAT方式启动虚拟机,设置虚拟机的网络适配器
Java 类型信息
<Thinking in Java 4th>第14章类型信息运行时类型信息(Run-Time Type Identification)使得你可以在程序运行时发现和使用类型信息. 14. ...
quartz中关键类
job job是一个接口,你对某一类job的定义,可以通过实现该接口来实现.例如为销售报告定义一个SalesReportJob,包含变量name. job可以使用的几个注解 @DisallowConc ...
oracle数据库连接字符串
不在项目加入tsname.ora的托管写法: <add name="CONN" connectionString="data source=127.0.0.1:15 ...
halcon，C# 学习
Halcon学习之一:查询图像参数 1.get_grayval ( Image : : Row, Column : Grayval ) 计算Image图像中坐标为(Row,Column)的点的灰度值G ...
可执行jar包的maven配置
待整理 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.or ...
C++100款开源界面库[转]
(声明:Alberl以后说到开源库,一般都是指著名的.或者不著名但维护至少3年以上的.那些把代码一扔就没下文的,Alberl不称之为开源库,只称为开源代码.这里并不是贬低,像Alberl前面那个系列的 ...
CloudStack服务引擎配置(cloud-engine-service模块)
"?>  <beans xmlns="http://www.springframework.org/schem ...
c# implicit explicit关键字(隐式和显式数据类型转换)
implicit关键字用于声明隐式的用户定义类型转换运算符.(explicit反之)explicit则用于显示转换用户自定义类型.static implicit operator target_typ ...

spark1.2.0编译

spark1.2.0编译的更多相关文章

随机推荐

热门专题