安装spark ha集群

安装spark ha集群 

1.默认安装好hadoop+zookeeper

2.安装scala

	1.解压安装包

		tar zxvf scala-2.11.7.tgz

	2.配置环境变量

		vim /etc/profile

		#scala

		export SCALA_HOME=/opt/scala-2.11.7

		#CLASSPATH

		export CLASSPATH=$CLASSPATH:$SCALA_HOME/lib

		#PATH

		export PATH=$PATH:$SCALA_HOME/bin

		保存退出

		source /etc/profile

	3.验证

		scala -version

3.安装spark

	1.解压安装包

		tar zxvf spark-1.6.0-bin-hadoop2.4.tgz

	2.配置环境变量

		vim /etc/profile

		#spark

		export SPARK_HOME=/opt/spark-1.6.0

		#CLASSPATH

		export CLASSPATH=$CLASSPATH:$SPARK_HOME/lib

		#PATH

		export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

		保存退出

		source /etc/profile

	3.修改配置文件

		1.根据模板复制相关配置文件

			cp spark-env.sh.template spark-env.sh

			cp slaves.template slaves

			cp log4j.properties.template log4j.properties

			cp spark-defaults.conf.template spark-defaults.conf

		2.创建相关目录

			mkdir /opt/spark-1.6.0/logs

			mkdir /opt/spark-1.6.0/tmp

			hadoop fs -mkdir /spark //在hdfs上创建存储spark的任务日志文件

		3.修改配置文件参数

			####spark-env.sh#### 最后加入 其中hadoop.master为主节点 hadoop.slaver1为备份主节点

			export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop.master:2181,hadoop.slaver1:2181 -Dspark.deploy.zookeeper.dir=/spark"

			export JAVA_HOME=/usr/java/jdk1.8.0_65

			export SPARK_WORKER_CORES=1

			export SPARK_WORKER_INSTANCES=1

			export SPARK_WORKER_MEMORY=1g

			####slaves####将所有的从节点主机名加入

			hadoop.slaver1

			hadoop.slaver2

			hadoop.slaver3

			####log4j.properties####

			无需修改

			####spark-defaults.conf####

			spark.eventLog.enabled  true

			spark.eventLog.dir      hdfs://ns1:8020/spark

			spark.history.fs.logDirectory      hdfs://ns1:8020/spark

			spark.eventLog.compress true

	4.分发到各个节点

		scp -r /opt/spark-1.6.0 hadoop@hadoop.slaver1:/opt

		scp -r /opt/spark-1.6.0 hadoop@hadoop.slaver2:/opt

		scp -r /opt/spark-1.6.0 hadoop@hadoop.slaver3:/opt

	5.启动

		//先启动zookeeper 和 hdfs

		sbin/start-all.sh   //注意切换目录  不然跟hadoop的start-all 冲突

		spark-shell --master spark://hadoop.master:7077  //集群模式启动客户端

		spark-shell     //单机模式启动客户端

	6.验证

		1.jps

		2.web

			节点主机名:8080  //如果采用默认端口的話则是8080  主节点web

			节点主机名:18080  //主节点 历史任务web

			节点主机名:4040   //子节点正在进行任务web

		3.HA

			在备份主机节点执行 start-master.sh命令

			然后在主机节点把master进程kill掉，此时会自行切换至备份节点(需要几秒钟的缓冲时间)

	7.常用命令

		1.启动

			start-all.sh  //注意切换目录

			start-master.sh

			stop-master.sh

			start-slave.sh 主节点:7077  //默认端口  如果不修改的話

			start-history-server.sh   //启动任务历史服务

		2.使用

			1.本机模式

				运行 spark-shell

			2.yarn

				打包运行jar包

				spark-submit

				--master spark://spark113:7077

				--class org.apache.spark.examples.SparkPi

				--name Spark-Pi --executor-memory 400M

				--driver-memory 512M

				/opt/spark-1.6.0/lib/spark-examples-1.6.0-hadoop2.4.0.jar

			3.wordcount

				val file=sc.textFile("hdfs://ns1:8020/huangzhijian/test.dat")

				val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)

				count.saveAsTextFile("hdfs://ns1:8020/output")  //需保证hdfs上该目录不存在

安装spark ha集群的更多相关文章

大数据-spark HA集群搭建
一.安装scala 我们安装的是scala-2.11.8 5台机器全部安装下载需要的安装包,放到特定的目录下/opt/workspace/并进行解压 1.解压缩 [root@master1 ~]# ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（九）安装kafka_2.11-1.1.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（八）安装zookeeper-3.4.12
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（三）安装spark2.2.1
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二）安装hadoop2.9.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
HUE配置文件hue.ini 的Spark模块详解（图文详解）（分HA集群和HA集群）
不多说,直接上干货! 我的集群机器情况是 bigdatamaster(192.168.80.10).bigdataslave1(192.168.80.11)和bigdataslave2(192.168 ...
Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装
Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装下载Storm-1.0.1 http://mirrors.tuna.tsinghua.edu.cn/apa ...
菜鸟玩云计算之十九：Hadoop 2.5.0 HA 集群安装第2章
菜鸟玩云计算之十九:Hadoop 2.5.0 HA 集群安装第2章 cheungmine, 2014-10-26 在上一章中,我们准备好了计算机和软件.本章开始部署hadoop 高可用集群. 2 部署 ...

随机推荐

Java集合之ArrayList
ArrayList ArrayList是最常见以及每个Java开发者最熟悉的集合类了,顾名思义,ArrayList就是一个以数组形式实现的集合,以一张表格来看一下ArrayList里面有哪些基本的元素 ...
ORA-01722:无效数字
今天写查询语句,关联多张表,出现了这个错误. 结果发现时字段的数据类型不一致. select * from table_a a,table_b b where to_char(a.project_id ...
windows命令
开始--运行--cmd 进入命令提示符输入netstat -ano 即可看到所有连接的PID 之后在任务管理器中找到这个PID所对应的程序如果任务管理器中没有PID这一项,可以在任务管理器中选&qu ...
Mac Pro 编译安装 Redis 的 PHP 客户端 phpredis
1.去官网下载 redis 扩展源码包 https://github.com/phpredis/phpredis 2.安装 redis 扩展 /usr/local/src/mac-sdk/source ...
java从基础知识（十）java多线程（下）
首先介绍可见性.原子性.有序性.重排序这几个概念原子性:即一个操作或多个操作要么全部执行并且执行的过程不会被任何因素打断,要么都不执行. 可见性:一个线程对共享变量值的修改,能够及时地被其它线程看到 ...
win10 系统亮度调节
win10系统发行后,许多用户尝试新的系统发现安装之后亮度无法调节,我也多次遇见此情况故在此记录修改方式: 打开注册表 -> 搜索键值featuretestcontrol -> 修改键值 ...
[原创]CSS3打造动态3D气球
周末在江边晨跑的时候发现很多当时心血来潮就想,应该可以在网页中实现一下这几天得闲就做了一下,效果如下 (尽量在最新版本的chrome或者firefox中查看) demo下载在文章最后预览 --& ...
DIV+CSS布局中主要CSS属性介绍
Float: Float属性是DIV+CSS布局中最基本也是最常用的属性,用于实现多列功能,我们知道<div>标签默认一行只能显示一个,而使用Float属性可以实现一行显示多个div的功能 ...
office 365 Sharepoint 2013
平台环境: office 365 Sharepoint 2013 操作文件和文件夹访问文档库的最佳方式是借助在 /_api/web 处可用的 GetFolderByServerRelativeUr ...
Express的搭建－－nodejs的学习
1,需要的学习环境 Node.js: 0.10.32 Express: 4.10.2 MongoDB: 2.6.1 2,安装Express $ npm install -g express-gener ...

安装spark ha集群

安装spark ha集群的更多相关文章

随机推荐

热门专题