分布式配置 Spark 2.0版本 2.1版本 1.6版本
apache的各个软件各个版本下载: http://archive.apache.org/dist/
1.下载spark.
sudo tar -zxf ~/下载/spark-2.0.2-bin-without-hadoop.tgz -C /usr/local/
cd /usr/local
sudo mv ./spark-2.0.2-bin-without-hadoop/ ./spark
sudo chown -R ubuntu ./spark
2.在Mster节点主机的终端中执行如下命令:
vim ~/.bashrc
    export SPARK_HOME=/usr/local/spark
    export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
  执行如下命令使得配置立即生效:
source ~/.bashrc
3.在Master节点主机上进行如下操作:
  配置slaves文件
    将 slaves.template 拷贝到 slaves
- cd /usr/local/spark/
 - cp ./conf/slaves.template ./conf/slaves
 
slaves文件设置Worker节点。编辑slaves内容,把默认内容localhost替换成如下内容:
    slave01    
  配置spark-env.sh文件
将 spark-env.sh.template 拷贝到 spark-env.sh
cp ./conf/spark-env.sh.template ./conf/spark-env.sh
编辑spark-env.sh,添加如下内容:
    export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)
    
    export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
    
    export SPARK_MASTER_IP=192.168.1.104
SPARK_MASTER_IP 指定 Spark 集群 Master 节点的 IP 地址;
配置好后,将Master主机上的/usr/local/spark文件夹复制到各个节点上。在Master主机上执行如下命令:
- cd /usr/local/
 - tar -zcf ~/spark.master.tar.gz ./spark
 - cd ~
 - scp ./spark.master.tar.gz slave01:/home/hadoop
 - scp ./spark.master.tar.gz slave02:/home/hadoop
 
在slave01,slave02节点上分别执行下面同样的操作:
- sudo rm -rf /usr/local/spark/
 - sudo tar -zxf ~/spark.master.tar.gz -C /usr/local
 - sudo chown -R hadoop /usr/local/spark
 
4.启动hadoop集群,在master节点上运行。
- cd /usr/local/hadoop/
 - sbin/start-all.sh
 
5.启动spark集群,在master节点上运行。
cd /usr/local/spark/
sbin/start-master.sh
在Master节点上运行jps命令,可以看到多了个Master进程:
    15093 Jps
    14343 SecondaryNameNode
    14121 NameNode
    14891 Master 
    14509 ResourceManager
启动所有Slave节点,在Master节点主机上运行如下命令:
sbin/start-slaves.sh
    37553 DataNode
    37684 NodeManager
    37876 Worker
    37924 Jps
http://172.19.57.221:8080/ spark web网页。
6.关闭spark集群
关闭Master节点
sbin/stop-master.sh
关闭Worker节点
sbin/stop-slaves.sh
关闭Hadoop集群
- cd /usr/local/hadoop/
 
- sbin/stop-all.sh
 
分布式配置 Spark 2.0版本 2.1版本 1.6版本的更多相关文章
- 转载:Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
		
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...
 - Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
		
摘自: http://www.cnblogs.com/kinglau/p/3796164.html http://www.powerxing.com/install-hadoop/ 当开始着手实践 H ...
 - Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04(转)
		
http://www.powerxing.com/install-hadoop/ http://blog.csdn.net/beginner_lee/article/details/6429146 h ...
 - 【转】Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
		
原文链接:http://dblab.xmu.edu.cn/blog/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单, ...
 - 分布式配置hadoop2.5.0  2.6.x
		
1. sudo vim /etc/hostname 在master的机器上,改成 master 在slave上写 slave01,02,03...... 配置好后重启. 2. sudo vi ...
 - Ubuntu14.04 安装配置Hadoop2.6.0
		
目前关于Hadoop的安装配置教程书上.官方教程.博客都有很多,但由于对Linux环境的不熟悉以及各种教程或多或少有这样那样的坑,很容易导致折腾许久都安装不成功(本人就是受害人之一).经过几天不断尝试 ...
 - Apache Spark 3.0 预览版正式发布,多项重大功能发布
		
2019年11月08日 数砖的 Xingbo Jiang 大佬给社区发了一封邮件,宣布 Apache Spark 3.0 预览版正式发布,这个版本主要是为了对即将发布的 Apache Spark 3. ...
 - CentOS 7.0下面安装并配置Spark
		
安装环境: 虚拟机:VMware® Workstation 8.0.1(网络桥接) OS:CentOS 7 JDK版本:jdk-7u79-linux-x64.tar Scala版本:scala-2.1 ...
 - 在eclipse中配置spark 0.9.1源码的开发环境
		
一.准备工作: 1.下载release版spark 0.9.1,本次用的版本是spark-0.9.1-bin-cdh4. 2.下载scala IDE 3.0.2,这个版本ide的支持scala 2.1 ...
 
随机推荐
- zabbix3监控php-fpm的状态
			
php-fpm和nginx一样内建了一个状态页,对于想了解php-fpm的状态以及监控php-fpm非常有帮助 . 启用php-fpm状态功能 [root@node1:~]# vim /usr/loc ...
 - encoding and Endian
			
Unicode, Code Point is the value of evry character in Unicode table(int,long,ll) Unicode defines a c ...
 - Android调试adb devices找不到设备【转】
			
adb驱动已经安装成功,但是adb devices却无法找到设备,USB大容量存储也是正常: 以前如果出现此种情况,我能想到的原因如下: 1.杀毒软件问题(关闭MacAfee) 2.驱动安装有误,重新 ...
 - select下拉框插件jquery.editable-select
			
项目中有个需求,下拉框既可以下拉选择,也可以手动填写 html代码 <span>数据来源</span> </select> js代码 $('#noMean').ed ...
 - 关于KEIL编译报错和警告问题
			
编译时候报错.. Library reports error: __use_no_semihosting was requested, but _ttywrch was referenced 上网找了 ...
 - ssd.pytorch
			
https://towardsdatascience.com/learning-note-single-shot-multibox-detector-with-pytorch-part-1-38185 ...
 - Cpython支持的进程与线程
			
一.multiprocessing模块介绍 python中的多线程无法利用CPU资源,在python中大部分情况使用多进程.python中提供了非常好的多进程包multiprocessing. mul ...
 - vue 之webpack打包工具的使用
			
一.什么是webpack? webpack是一个模块打包工具.用vue项目来举例:浏览器它是只认识js,不认识vue的.而我们写的代码后缀大多是.vue的,在每个.vue文件中都可能html.js.c ...
 - jsp 修饰 Request 及Response
			
Servlet API包含4个可修饰的类,用于改变Servlet Request以及Servlet Response.这种修饰允许修改 ServletRequest以及ServletResponse或 ...
 - PHP Warning:  mysqli_connect(): The server requested authentication method unknown to the client [caching_sha2_password] in /usr/local/php/CreateDB.php on line 5
			
原因:php还不支持mysql8.0最新的密码加密方式 ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY ' ...