配置Spark

参考《深入理解Spark:核心思想与源码分析》

　　Spark使用Scala进行编写，而Scala又是基于ＪＶＭ运行，所以需要先安装JDK，这个不再赘述。

１．安装Scala

　　安装获取Scala:

 wget http://download.typesafe.com/scala/2.11.5/scala-2.11.5.tgz

　　将下载的文件移动到自家想要放置的目录。

　　修改压缩文件的权限为７５５（所有者读写执行，同组成员读和执行，其他成员读和执行）

chmod 755 scala-2.11.5.tgz

　　解压缩：

tar -xzvf scala-2.11.5.tgz

　　打开/etc/profile，添加scala的环境变量

vim /etc/profile

　　查看scala是否安装成功：

scala

２．安装完scala后，就要安装spark了

　　只接从网站上下载了spark安装包：

　　http://spark.apache.org/downloads.html

　　将安装包移动到自己指定的位置，解压缩。

　　配置环境变量：

　　vim /etc/profile

　　添加spark环境变量

　　使环境变量生效：

　　source /etc/profile

　　进入spark的conf文件目录，

　　cd /home/hadoop/spark/spark-2.1.0-bin-hadoop2.7/conf

　　cp spark-env.sh.template  spark-env.sh

　　在spark-env.sh目录中添加java hadoop scala的环境变量

　　启动spark:

　　cd /home/hadoop/spark/spark-2.1.0-bin-hadoop2.7/sbin

　　./start-all.sh

　　打开浏览器，输入http://localhost:8080

　　　可见Spark已经运行了。

http://blog.csdn.net/wuliu_forever/article/details/52605198这个博客写的很好

配置Spark的更多相关文章

配置Spark on YARN集群内存
参考原文:http://blog.javachen.com/2015/06/09/memory-in-spark-on-yarn.html?utm_source=tuicool 运行文件有几个G大,默 ...
CentOS 7.0下面安装并配置Spark
安装环境: 虚拟机:VMware® Workstation 8.0.1(网络桥接) OS:CentOS 7 JDK版本:jdk-7u79-linux-x64.tar Scala版本:scala-2.1 ...
spark快速入门之最简配置 spark 1.5.2 hadoop 2.7 配置
配置的伪分布式,ubuntu14.04上先配置hadoop,参见这个博客,讲的很好 http://www.powerxing.com/install-hadoop/, 但是我在配的过程中还是遇到了问 ...
安装配置Spark集群
首先准备3台电脑或虚拟机,分别是Master,Worker1,Worker2,安装操作系统(本文中使用CentOS7). 1.配置集群,以下步骤在Master机器上执行 1.1.关闭防火墙:syste ...
Linux中安装配置spark集群
一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoop MapReduce所 ...
配置spark集群
配置spark集群 1.配置spark-env.sh [/soft/spark/conf/spark-env.sh] ... export JAVA_HOME=/soft/jdk 2.配置slaves ...
linux上配置spark集群
环境: linux spark1.6.0 hadoop2.2.0 一.安装scala(每台机器) 1.下载scala-2.11.0.tgz 放在目录: /opt下,tar -zxvf scal ...
在win10环境下IED配置spark项目
eclipse在对spark的支持上并不友好,所以需要新下载并安装IntelliJ IDEA 2019.1.我下载安装的是专业版的,直接在网上搜索了破解码进行破解. 1. 配置java和scala I ...
Windows32或64位下载安装配置Spark
[学习笔记] Windows 32或64位下载安装配置Spark:1)下载地址:http://spark.apache.org/downloads.html 马克-to-win @ 马克java社区: ...
Jupyter配置Spark开发环境
兄弟连大数据培训和大家一起探究Jupyter配置 Spark 开发环境简介为Jupyter配置Spark开发环境,可以安装全家桶–Spark Kernel或Toree,也可按需安装相关组件. 考虑 ...

随机推荐

Linux动态库生成与使用指南
相关阅读: Linux静态库生成指南 Linux下动态库文件的文件名形如 libxxx.so,其中so是 Shared Object 的缩写,即可以共享的目标文件. 在链接动态库生成可执行文件时,并不 ...
第四周结对项目总结及改进（ui/web）
项目介绍随着社会科技的进步和多媒体教育的日益发展,越来越来的学生正在接受着新时代下的教育模式,而且手机.电脑等科技产品的普及以及其带来的更高效更便捷的模式使得它们成为当代学生学习中的一种很好的学习 ...
git 20181119
不同分支间(a.b分支)合并部分文件 git ck b git ck a f1 f2 git配置配置文件系统git config --system --list 全局git config --gl ...
HBSX2019 游记
Day -4 训练戳SX2019 3月训练 ZJOI2019 Day1几天前就考了 T1真考了麻将QwQ 九条可怜的毒瘤真的是业界良心今天中午才起,要开始调整生物钟了 9012HBOIers群里讨论 ...
【转】协同开发中SVN使用规范试用
转自:http://www.cnblogs.com/BraveCheng/archive/2012/07/02/2573617.html 协同开发中SVN使用规范试用目标,要求本次svn提交规范主 ...
OpenCV中Mat总结
一.数字图像存储概述数字图像存储时,我们存储的是图像每个像素点的数值,对应的是一个数字矩阵. 二.Mat的存储 1.OpenCV1基于C接口定义的图像存储格式IplImage*,直接暴露内存,如果忘 ...
windows下实现定时重启Apache与MySQL方法
采用at命令添加计划任务.有关使用语法可以到window->“开始”->运行“cmd”->执行命令“at /”,这样界面中就会显示at命令的语法.下面我们讲解下如何让服务器定时启动a ...
【原创】大数据基础之Alluxio（1）简介、安装、使用
Alluxio 1.8.1 官方:http://www.alluxio.org/ 一简介 Open Source Memory Speed Virtual Distributed StorageAl ...
Python-Django 模板层
1 模版简介 DTL:django模板语言核心: 变量 {{ }} 标签 {% %} 2 模版语法之变量 -变量渲染:{{变量}} -变量深度查询:{{变量.索引/key值/方法}} <h2& ...
CENTOS 7 安装 TINYPROXY 代理服务器
https://www.cnblogs.com/new_2050/p/7658508.html

配置Spark

配置Spark的更多相关文章

随机推荐

热门专题