一、spark安装

　　因为之前安装过hadoop，所以，在“Choose a package type”后面需要选择“Pre-build with user-provided Hadoop [can use with most Hadoop 　　distributions]”，然后，点击“Download Spark”后面的“spark-2.1.0-bin-without-hadoop.tgz”下载即可。Pre-build with user-provided Hadoop: 　　属于“Hadoop free”版，这样，下载到的Spark，可应用到任意Hadoop 版本。　　

　　上传spark软件包到任意节点上

　　解压缩spark软件包到/usr/local/目录下

　　重命名为spark文件夹

　　　　 mv spark-2.1.0-bin-without-hadoop/ spark

　　重命名conf/目录下spark-env.sh.template为spark-env.sh

　　　　cp spark-env.sh.template spark-env.sh

　　重命名conf/目录下slaves.template为slaves

　　　　mv slaves.template slaves

二、配置spark

　　　编辑conf/spark-env.sh文件，在第一行添加以下配置信息:

　　　　　　export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

　　　　　　＃上述表示Spark可以把数据存储到Hadoop分布式文件系统HDFS中，也可以从HDFS中读取数据。如果没有配置上面信息，Spark就只能读写本地数据，无法读写HDFS数据。

　　　　　　export JAVA_HOME=/usr/local/jdk64/jdk1.8.0

　　　编辑conf/slaves文件

三、验证spark是否安装成功

　　在spark目录中输入命令验证spark是否安装成功

　　　　　　bin/run-example SparkPi

　　　　　　bin/run-example SparkPi 2>&1 | grep "Pi is"　　　　　　　　#过滤显示出pi的值

　　　　web界面为8080端口

　　集群模式下shell

　　　pyspark --master spark://master:7077　　　　#python

　　提交应用

　　　　spark-submit

　　　　　　--class <main-class> 　　　　　　　　#需要运行的程序的主类，应用程序的入口点
　　　　　　--master <master-url> 　　　　　　　#Master URL，下面会有具体解释
　　　　　　--deploy-mode <deploy-mode> 　　 #部署模式
　　　　　　... # other options 　　　　　　　　　 #其他参数
　　　　　　<application-jar> 　　　　　　　　　 #应用程序JAR包
　　　　　　[application-arguments]　　　　　　 #传递给主类的主方法的参数

hadoop+hive+spark搭建（三）的更多相关文章

hadoop+hive+spark搭建（一）
1.准备三台虚拟机 2.hadoop+hive+spark+java软件包传送门:Hadoop官网 Hive官网 Spark官网一.修改主机名,hosts文件主机名修改 hostnam ...
hadoop+hive+spark搭建（二）
上传hive软件包到任意节点一.安装hive软件解压缩hive软件包到/usr/local/hadoop/目录下重命名hive文件夹在/etc/profile文件中添加环境变量 export ...
大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...
hadoop和spark搭建记录
因玩票需要,使用三台搭建spark(192.168.1.10,192.168.1.11,192.168.1.12),又因spark构建在hadoop之上,那么就需要先搭建hadoop.历经一个两个下午 ...
了解大数据的技术生态系统 Hadoop,hive,spark(转载)
首先给出原文链接: 原文链接大数据本身是一个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的.你能够把它比作一个厨房所以须要的各种工具. 锅碗瓢盆,各 ...
一文教你看懂大数据的技术生态圈:Hadoop,hive,spark
转自:https://www.cnblogs.com/reed/p/7730360.html 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞 ...
配置Hadoop,hive,spark,hbase ————待整理
五一一天在家搭建好了集群,要上班了来不及整理,待下周周末有时间好好整理整理一个完整的搭建hadoop生态圈的集群的系列若出现license information(license not accep ...
Hadoop集群搭建(三)~centos6.8网络配置
安装完centos之后,进入系统,进行网络配置.主要分为五个部分: 修改虚拟机网络编辑器:配置Winodws访问虚拟机:配置centos网卡:通过网络名访问虚拟机配置网络服务. (一)虚拟机网络编辑器 ...
服务器Hadoop+Hive搭建
出于安全稳定考虑很多业务都需要服务器服务器Hadoop+Hive搭建,但经常有人问我,怎么去选择自己的配置最好,今天天气不错,我们一起来聊一下这个话题. Hadoop+Hive环境搭建 1虚拟机和系统 ...

随机推荐

C++基础——C面向过程与C++面向对象编程01_圆面积求解
#include "iostream";//包含C++的头文件using namespace std;//使用命名空间std标准的命名空间(在这个命名空间中定义了很多标准定义)vo ...
1.WP8.1开发_去除闪动效果，直接进入首页
有时候希望打开软件的时候,不出现闪屏,而直接进入到第一个页面. 把第一个页面作为闪屏,可以制作一些进度条和动画等... 很简单,有两种方法去除闪屏. 1.删除项目下 Assets 文件夹里面的Sp ...
Android开发之Bitmap的高效加载
BitmapFactory类提供了四类方法:decodeFile, decodeResource, decodeStream和decodeByteArray 分别用于支持从文件系统,资源,输入流以及字 ...
在ExpressJS中设置二级域名跨域共享Cookie
问题:我使用expressjs和mongostore来管理session.下面是expressjs中的设置. app.configure(function(){ app.use(express.ses ...
ECMASCRIPT5新特性（转载）
Function 1: Object.create 这是一个很重要的改动,现在我们终于可以得到一个原型链干净的对象了.以前要创建一个类 function Cat(name) { this.name ...
Hive基础知识梳理
Hive简介 Hive是什么 Hive是构建在Hadoop之上的数据仓库平台. Hive是一个SQL解析引擎,将SQL转译成MapReduce程序并在Hadoop上运行. Hive是HDFS的一个文件 ...
API测试自动化——基于CDIF的SOA基本功能（实例篇）
今天我们通过一些实例来体验一下API的自动化测试,感受一下基于CDIF的SOA的一些基本功能. 传统的测试工具在测试一个API的时候,必须手动填写这个API所需要接收的所有信息,比如一个查询航班动态的 ...
初识Object-C
Object-C是苹果推出用来开发苹果软件的一门编程语言.大学学了3年的JAVA,到了大四毅然决然的放弃JAVA,是因为第一次接触Object-C就被它的简单语法吸引了.其实不仅仅是语法简单,相对于A ...
【转】AS3多种天气预报调用代码分享
今天我们来介绍利用weather.com.cn上的天气预报功能,这里介绍了大家常用的,其它的大家可以自己去下载. 我们这里的天气预览不需要js来调用,只要用iframe就可以了,更不需要ASP/' t ...
DC平衡双向控制串行器转接IC GM8913:LVTTL转FPD-LINK III芯片
1 概述 GM8913型DC平衡双向控制串行器,其主要功能是实现将10或12位并行控制信号和一路时钟信号串行为一路2.8Gbps高速串行数据:同时接收低速通道信号实现模式配对的功能.芯片内部集 ...

hadoop+hive+spark搭建（三）

一、spark安装

上传spark软件包到任意节点上

解压缩spark软件包到/usr/local/目录下

重命名为spark文件夹

重命名conf/目录下spark-env.sh.template为spark-env.sh

重命名conf/目录下slaves.template为slaves

二、配置spark

编辑conf/spark-env.sh文件，在第一行添加以下配置信息:

编辑conf/slaves文件

三、验证spark是否安装成功

在spark目录中输入命令验证spark是否安装成功

集群模式下shell

pyspark --master spark://master:7077 #python

提交应用

hadoop+hive+spark搭建（三）的更多相关文章

随机推荐

热门专题

　　上传spark软件包到任意节点上

　　解压缩spark软件包到/usr/local/目录下

　　重命名为spark文件夹

　　重命名conf/目录下spark-env.sh.template为spark-env.sh

　　重命名conf/目录下slaves.template为slaves

　　　编辑conf/spark-env.sh文件，在第一行添加以下配置信息:

　　　编辑conf/slaves文件

　　在spark目录中输入命令验证spark是否安装成功

　　集群模式下shell

　　　pyspark --master spark://master:7077　　　　#python

　　提交应用