spark 2.1.0 集群安装

jdk安装

http://www.cnblogs.com/xiaojf/p/6568426.html

scala2.11 安装

http://www.cnblogs.com/xiaojf/p/6568432.html

hadoop2.7 安装

http://www.cnblogs.com/xiaojf/p/6629351.html

开始spark2.1.0安装

解压

[root@m1 jar]# tar zxvf spark-2.1.-bin-hadoop2..tgz -C ../

重命名

[root@m1 jar]# cd ..

[root@m1 soft]# ll

total

drwxr-xr-x.  root   root    Mar  : hadoop

drwxr-xr-x.   root   root    Mar  : jar

drwxr-xr-x.   root   root    Dec  : jdk

drwxr-xr-x.   root   root    Mar  : kafka

drwxrwxr-x.   root   root    Mar     scala-2.11.

drwxr-xr-x.  xiaojf xiaojf  Dec  : spark-2.1.-bin-hadoop2.

drwxr-xr-x.   root   root    Mar  : tmp

drwxr-xr-x.  root   root    Aug    zookeeper-3.4.

[root@m1 soft]# mv spark-2.1.-bin-hadoop2. spark

[root@m1 soft]# ll

total

drwxr-xr-x.  root   root    Mar  : hadoop

drwxr-xr-x.   root   root    Mar  : jar

drwxr-xr-x.   root   root    Dec  : jdk

drwxr-xr-x.   root   root    Mar  : kafka

drwxrwxr-x.   root   root    Mar     scala-2.11.

drwxr-xr-x.  xiaojf xiaojf  Dec  : spark

drwxr-xr-x.   root   root    Mar  : tmp

drwxr-xr-x.  root   root    Aug    zookeeper-3.4.

配置环境变量

[root@m1 soft]# vi /etc/profile

[root@m1 soft]# source /etc/profile

export SPARK_HOME=/usr/local/soft/spark

export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

修改配置文件

[root@m1 soft]# cd /usr/local/soft/spark/conf/

[root@m1 conf]# pwd

/usr/local/soft/spark/conf

[root@m1 conf]# ll

total

-rw-r--r--.  xiaojf xiaojf   Dec  : docker.properties.template

-rw-r--r--.  xiaojf xiaojf  Dec  : fairscheduler.xml.template

-rw-r--r--.  xiaojf xiaojf  Dec  : log4j.properties.template

-rw-r--r--.  xiaojf xiaojf  Dec  : metrics.properties.template

-rw-r--r--.  xiaojf xiaojf   Dec  : slaves.template

-rw-r--r--.  xiaojf xiaojf  Dec  : spark-defaults.conf.template

-rwxr-xr-x.  xiaojf xiaojf  Dec  : spark-env.sh.template

[root@m1 conf]# cp log4j.properties.template log4j.properties

[root@m1 conf]# cp slaves.template slaves

[root@m1 conf]# cp spark-defaults.conf.template spark-defaults.conf

[root@m1 conf]# cp spark-env.sh.template spark-env.sh

修改 spark-defaults.conf

[root@m1 conf]# vi spark-defaults.conf

spark.eventLog.enabled           true

spark.eventLog.dir              hdfs://m1:9000/historyserverforSpark

spark.executor.extraJavaOptions  -XX:+PrintGCDetails -Dkey=value -Dnumbers="one two three"

spark.yarn.historyServer.address   m1:

spark.history.fs.logDirectory      hdfs://m1:9000/historyserverforSpark

spark.driver.memory              5g

修改 spark-env.sh

[root@m1 conf]# vi spark-env.sh

export HADOOP_HOME=/usr/local/soft/hadoop

export HADOOP_CONF_DIR=/usr/local/soft/hadoop/etc/hadoop

export JAVA_HOME=/usr/local/soft/jdk

export SCALA_HOME=/usr/local/soft/scala

export SPARK_MASTER_IP=m1

export SPARK_WORKER_MEMORY=1G

export SPARK_EXECUTOR_MEMORY=1G

export SPARK_DRIVER_MEMORY=1G

export SPARK_WORKER_CORES=

修改 slaves

[root@m1 conf]# vi slaves

s1

s2

分发代码到集群节点

[root@m1 soft]# scp -r spark root@s1:/usr/local/soft/

[root@m1 soft]# scp -r spark root@s2:/usr/local/soft/

启动

[root@m1 soft]# cd /usr/local/soft/spark/sbin/

[root@m1 sbin]# ll

total

-rwxr-xr-x.  xiaojf xiaojf  Dec  : slaves.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : spark-config.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : spark-daemon.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : spark-daemons.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-all.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-history-server.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-master.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-mesos-dispatcher.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-mesos-shuffle-service.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-shuffle-service.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-slave.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-slaves.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : start-thriftserver.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-all.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-history-server.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-master.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-mesos-dispatcher.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-mesos-shuffle-service.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-shuffle-service.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-slave.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-slaves.sh

-rwxr-xr-x.  xiaojf xiaojf  Dec  : stop-thriftserver.sh

[root@m1 sbin]# ./start-all.sh

starting org.apache.spark.deploy.master.Master, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.master.Master--m1.out

s1: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker--s1.out

s2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker--s2.out

查看进程

[root@m1 sbin]# jps

 Master

 Kafka

 Jps

 QuorumPeerMain

这个时候还没有启动hadoop，所以先启动hadoop，再启动spark

[root@m1 sbin]# /usr/local/soft/hadoop/sbin/start-all.sh

This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh

Starting namenodes on [m1]

m1: starting namenode, logging to /usr/local/soft/hadoop/logs/hadoop-root-namenode-m1.out

s2: starting datanode, logging to /usr/local/soft/hadoop/logs/hadoop-root-datanode-s2.out

s1: starting datanode, logging to /usr/local/soft/hadoop/logs/hadoop-root-datanode-s1.out

Starting secondary namenodes [m1]

m1: starting secondarynamenode, logging to /usr/local/soft/hadoop/logs/hadoop-root-secondarynamenode-m1.out

starting yarn daemons

starting resourcemanager, logging to /usr/local/soft/hadoop/logs/yarn-root-resourcemanager-m1.out

s2: starting nodemanager, logging to /usr/local/soft/hadoop/logs/yarn-root-nodemanager-s2.out

s1: starting nodemanager, logging to /usr/local/soft/hadoop/logs/yarn-root-nodemanager-s1.out

[root@m1 sbin]# jps

 ResourceManager

 Kafka

 SecondaryNameNode

 NameNode

 Jps

 QuorumPeerMain

[root@m1 sbin]# /usr/local/soft/spark/sbin/start-all.sh

starting org.apache.spark.deploy.master.Master, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.master.Master--m1.out

s2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker--s2.out

s1: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/soft/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker--s1.out

[root@m1 sbin]# jps

 ResourceManager

 Kafka

 SecondaryNameNode

 Master

 NameNode

 Jps

 QuorumPeerMain

打开spark-shell 测试

[root@m1 sbin]# spark-shell

完成

spark 2.1.0 集群安装的更多相关文章

hadoop 2.2.0集群安装详细步骤（简单配置，无HA）
安装环境操作系统:CentOS 6.5 i586(32位)java环境:JDK 1.7.0.51hadoop版本:社区版本2.2.0,hadoop-2.2.0.tar.gz 安装准备设置集群的host ...
CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
Spark On YARN 分布式集群安装
一.导读最近开始学习大数据分析,说到大数据分析,就必须提到Hadoop与Spark.要研究大数据分析,就必须安装这两个软件,特此记录一下安装过程.Hadoop使用V2版本,Hadoop有单机.伪分布 ...
hadoop 2.2.0集群安装
相关阅读: hbase 0.98.1集群安装本文将基于hadoop 2.2.0解说其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.csdn.net ...
ElasticSearch 5.0.0 集群安装部署文档
1. 搭建环境 3台物理机操作系统 centos7 es1 192.168.31.141 4g内存 2核 es2 192.168.31.142 4g内存 2核 es3 ...
CentOS下Storm 1.0.0集群安装具体解释
本文环境例如以下: 操作系统:CentOS 6 32位 ZooKeeper版本号:3.4.8 Storm版本号:1.0.0 JDK版本号:1.8.0_77 32位 python版本号:2.6.6 集群 ...
Linux基于Hadoop2.8.0集群安装配置Hive2.1.1及基础操作
前言安装Apache Hive前提是要先安装hadoop集群,并且hive只需要在hadoop的namenode节点集群里安装即可,安装前需保证Hadoop已启(动文中用到了hadoop的hdfs命 ...
spark 2.0.0集群安装与hive on spark配置
1. 环境准备: JDK1.8 hive 2.3.4 hadoop 2.7.3 hbase 1.3.3 scala 2.11.12 mysql5.7 2. 下载spark2.0.0 cd /home/ ...
最新版spark1.1.0集群安装配置
和分布式文件系统和NoSQL数据库相比而言,spark集群的安装配置还算是比较简单的: 很多教程提到要安装java和scala,但我发现spark最新版本是包含scala的,JRE采用linux内嵌的 ...

随机推荐

Unity编译Android的原理解析和apk打包分析
作者介绍:张坤最近由于想在Scene的脚本组件中,调用Android的Activity的相关接口,就需要弄明白Scene和Activity的实际对应关系,并对Unity调用Android的部分原理进 ...
children 和childNodes 的区别
1:childNodes /children相同点:它返回指定元素的子元素集合. 2:区别:children : 它是非标准的,仅返回HTML节点.甚至不返回文本节点.所有浏览器表现一致. chi ...
iTunes制作iPhone手机铃声方法（mac版2017年4月更新）
iTunes制作iPhone手机铃声方法(mac版2017年4月更新) 跟之前百度出来的不同,我自己使用后写的. 1.首先下载好你需要制作铃声的mp3文件,这里我放在桌面. 2 ...
Python中字符串拼接的三种方式
在Python中,我们经常会遇到字符串的拼接问题,在这里我总结了三种字符串的拼接方式: 1.使用加号(+)号进行拼接加号(+)号拼接是我第一次学习Python常用的方法,我们只需要把我们要加 ...
for xml path 如何将字段转换为xml的属性
for xml path 如何将字段作为xml的属性: 可在查询时别名用 as ＇@．．＇如'@value' 如下实例: SELECT A.GiftSetGUID AS '@value',A.Gi ...
React之key详解
一个例子有这样的一个场景如下图所示,有一组动态数量的input,可以增加和删除和重新排序,数组元素生成的组件用index作为key的值,例如下图生成的ui展示: 上面例子中的input组件渲染的代码 ...
关于用jQuery的animate方法实现的动画在IE中失效的原因以及解决方法
这几天在学jQuery,本身还只是一个新手,写了一个简单的动画--圆形头像的缩放.本身是用Firefox进行调试的,一切进行的很顺利,缩放可以按照预期执行,结果拿到IE上去之后,发现缩放动画失效了.后 ...
LeetCode 108: Convert Sorted Array to Binary Search Tree DFS求解
Given an array where elements are sorted in ascending order, convert it to a height balanced BST. 解题 ...
10个漂亮的jQuery日历插件下载【转载】
10个漂亮的jQuery日历插件下载 2013-08-07 标签:jQuery日历插件jQuery日历jQuery插件日期是非常重要的,随时随地.微薄或网站的日期选取器日历必须在那里.您可以使用 ...
04(1) 基于上下文相关的GMM-HMM声学模型1
1.上下文对音素发音的语谱轨迹的影响受到上下文的影响,同一个音素的发音语谱轨迹不同为提高识别准确率,对音素建模时应将这种上下文影响考虑在内 2.基于上下文相关的音素建模注意,非单音素建模中,每个 ...

spark 2.1.0 集群安装

spark 2.1.0 集群安装的更多相关文章

随机推荐

热门专题