Dream------spark--spark集群的环境搭建

1、下载安装scala

http://www.scala-lang.org/download/2.11.6.html

2、解压下载后的文件，配置环境变量：编辑/etc/profile文件，添加如下内容：

export SCALA_HOME=/root/scala-2.11.6

export PATH=$SCALA_HOME/bin:$PATH

运行source /etc/profile使环境变量的修改立即生效

3、配置conf/spark-env.sh环境变量

进入$SPARK_HOME/conf 目录，将 spark-env.sh.template 重命名为 spark-env.sh，修改 spark-env.sh，添加如下内容

export JAVA_HOME=/usr/java/jdk1.8.0_45

export SPARK_MASTER_IP=wls01

#export SPARK_MASTER_IP=localhost

export SPARK_MASTER_PORT=7077

export SPARK_WORKER_CORES=1

export SPARK_WORKER_INSTANCES=1

export SPARK_WORKER_MEMORY=1g

　　export HADOOP_HOMEE=/root/hadoop-2.6.0

#export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/nfs/spark/recovery"

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SPARK_HOME=/root/spark-1.4.1-bin-hadoop2.6

export SPARK_JAR=/root/spark-1.4.1-bin-hadoop2.6/lib/spark-assembly-1.4.1-hadoop2.6.0.jar

export PATH=$SPARK_HOME/bin:$PATH

4、修改/conf/slaves文件

wls02

wls03

5、拷贝到其他机器

scp scala-2.11.6.tgz root@wls02:/root

scp scala-2.11.6.tgz root@wls03:/root

scp spark-1.4.1-bin-hadoop2.6.zip root@wls03:/root

scp spark-1.4.1-bin-hadoop2.6.zip root@wls02:/root

scp spark-1.4.1-bin-hadoop2.6/conf/* root@wls02:/root/spark-1.4.1-bin-hadoop2.6/conf/

6、修改权限(不修改貌似也行，因为本身就是可执行文件)

bin目录下

chmod a+x spark-shell

chmod a+x spark-submit

chmod a+x spark-class

chmod a+x compute-classpath.sh

sbin目录下

chmod a+x *.sh

7、启动

cd到sbin目录下

./start-all.sh

运行（集群模式，其他模式官网写的很清楚，直接运行就可以）

重点就是class，是自己的类，jars有mysql的驱动和项目打的jar包

　　（官网的例子）

./bin/spark-submit --class org.apache.spark.examples.SparkPi \

    --master yarn-cluster \

    --num-executors 3 \

    --driver-memory 4g \

    --executor-memory 2g \

    --executor-cores 1 \

    --queue thequeue \

    lib/spark-examples*.jar \

    10

（自己写的推荐）

./bin/spark-submit --class \

com.tuijian.SparkToJDBC \

--master yarn-cluster \

--num-executors  \

--driver-memory 1g \

--executor-memory 1g \

--executor-cores  \

--jars /root/founderRecommend.jar \

lib/mysql*.jar

wls01:8080

这样也行

# /etc/profile

# System wide environment and startup programs, for login setup

# Functions and aliases go in /etc/bashrc

###########java

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/protobuf/lib

export JAVA_HOME=/usr/soft/jdk1.7.0_71

PATH=$PATH:$JAVA_HOME/bin

#CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:/usr/soft/jdk1.7.0_71/lib/tools.jar

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

#############hadoop

export HADOOP_INSTALL=/usr/hadoopsoft/hadoop-2.5.2

export HADOOP_HOME=$HADOOP_INSTALL

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_CONF_DIR=$HADOOP_INSTALL/etc/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

###########scala

SCALA_HOME=/usr/soft/scala-2.10.4

MVN_HOME=/usr/soft/apache-maven-3.1.1

ANT_HOME=/usr/soft/apache-ant-1.9.4

MAHOUT_HOME=/root/mahout-mahout-0.9

PATH=$PATH:$SCALA_HOME/bin:$MVN_HOME/bin:$ANT_HOME/bin:$MAHOUT_HOME/bin

export FINDBUGS_HOME=/usr/soft/findbugs-3.0.0

PATH=$PATH:$FINDBUGS_HOME/bin

export PATH

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"

###############################

export SPARK_HOME=/usr/hadoopsoft/spark-1.3.1-bin-hadoop2.4

export MASTER=spark://spark001:7077

export SPARK_JAR=/usr/hadoopsoft/spark-1.3.1-bin-hadoop2.4/lib/spark-assembly-1.3.1-hadoop2.4.0.jar

export PATH=$SPARK_HOME/bin:$PATH

#It's NOT a good idea to change this file unless you know what you

# are doing. It's much better to create a custom.sh shell script in

# /etc/profile.d/ to make custom changes to your environment, as this

# will prevent the need for merging in future updates.

pathmunge () {

case ":${PATH}:" in

*:"$1":*)

;;

if [ "$2" = "after" ] ; then

PATH=$PATH:$1

else

PATH=$1:$PATH

esac

}

if [ -x /usr/bin/id ]; then

if [ -z "$EUID" ]; then

# ksh workaround

EUID=`id -u`

UID=`id -ru`

USER="`id -un`"

LOGNAME=$USER

MAIL="/var/spool/mail/$USER"

# Path manipulation

if [ "$EUID" = "0" ]; then

pathmunge /sbin

pathmunge /usr/sbin

pathmunge /usr/local/sbin

else

pathmunge /usr/local/sbin after

pathmunge /usr/sbin after

pathmunge /sbin after

HOSTNAME=`/bin/hostname 2>/dev/null`

HISTSIZE=1000

if [ "$HISTCONTROL" = "ignorespace" ] ; then

export HISTCONTROL=ignoreboth

else

export HISTCONTROL=ignoredups

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

# By default, we want umask to get set. This sets it for login shell

# Current threshold for system reserved uid/gids is 200

# You could check uidgid reservation validity in

# /usr/share/doc/setup-*/uidgid file

if [ $UID -gt 199 ] && [ "`id -gn`" = "`id -un`" ]; then

umask 002

else

umask 022

for i in /etc/profile.d/*.sh ; do

if [ -r "$i" ]; then

if [ "${-#*i}" != "$-" ]; then

. "$i"

else

. "$i" >/dev/null 2>&1

done

unset i

unset -f pathmunge

Dream------spark--spark集群的环境搭建的更多相关文章

centos 8 集群Linux环境搭建
一.集群Linux环境搭建 1. 注意事项 1.1 windows系统确认所有的关于VmWare的服务都已经启动打开任务管理器->服务,查看五个VM选项是否打开. 1.2 确认好VmWare生 ...
Hadoop入门(五) Hadoop2.7.5集群分布式环境搭建
本文接上文内容继续: server01 192.168.8.118 jdk.www.fengshen157.com/ hadoop NameNode.DFSZKFailoverController(z ...
部署k8s集群之环境搭建和etcd单节点安装
环境搭建以及etcd 单节点安装过程安装之前的环境搭建在进行k8s安装之前先把虚拟机准备好,这里准备的是三台虚拟机主机名 ip地址角色 master 172.16.163.131 master ...
hadoop学习笔记（六）：hadoop全分布式集群的环境搭建
本文原创,如需转载,请注明作者以及原文链接! 一.前期准备: 1.jdk安装不要用centos7自带的openJDK2.hostname 配置配置位置:/etc/s ...
性能测试：k8s集群监控环境搭建（kube-prometheus）
选择kube-prometheus版本 k8s集群版本是1.22.x 5个节点说明:如果你电脑配置低,也可以1个master节点,2个node节点 3个节点 Kube-Prometheus地址:ht ...
MQ集群测试环境搭建(多节点负载均衡，共享一个kahaDB文件(nas方式))
1. os ubuntu12.04 基础环境准备干掉不好用的vim重新装 sudo apt-get remove vim-common sudo apt-get install vim 如果需要使用 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十一）NIFI1.7.1安装
一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120 master 192.168.0.121 slave1 192.168.0.122 sla ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十三）kafka+spark streaming打包好的程序提交时提示虚拟内存不足（Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical memory used; 2.2 GB of 2.1 G）
异常问题:Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical mem ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十二）VMW安装四台CentOS，并实现本机与它们能交互，虚拟机内部实现可以上网。
Centos7出现异常:Failed to start LSB: Bring up/down networking. 按照<Kafka:ZK+Kafka+Spark Streaming集群环境搭 ...

随机推荐

javascript定时保存表单数据的代码
(忘记是不是两家邮箱都有这个功能). 那这个功能是怎么做的呢? 定时,我们知道怎么弄,但保存呢?也许我们会通过隐藏域等手段来存放数据.但是,这个却有个缺点:那就是刷新页面后,数据将会丢失. 而此时,就 ...
Augmenting DOM Storage with IE's userData behavior
http://www.javascriptkit.com/javatutors/domstorage2.shtml Augmenting DOM Storage with IE's userData ...
CentOS6.7的安装
VMware9的安装请阅读: http://www.cnblogs.com/duanji/p/yueding.html CentOS6.7在VMware9中安装 1．启动VMware的画面 2．点击 ...
NAT alg 和 ASPF
NAT alg 和 ASPF 参考:https://handbye.cn/719.html 来源:https://www.jianshu.com/p/8a8eb36eef7d NAT的部署已经在企业网 ...
[洛谷P3829][SHOI2012]信用卡凸包
题目大意:有$n$张一模一样的信用卡,每个角进行了圆滑处理,问这些卡组成的“凸包”的周长题解:发现是圆滑处理的圆心围成的凸包加上一个圆周即可卡点:输入长宽弄反,然后以为是卡精 C++ Code: ...
【UOJ#80】二分图最大权匹配（KM）
题面 UOJ 题解模板qaq #include<iostream> #include<cstdio> #include<cstdlib> #include< ...
51nod 1564 区间的价值 | 分治尺取法
51nod 1564 区间的价值题面一个区间的价值是区间最大值×区间最小值.给出一个序列$a$, 求出其中所有长度为k的子区间的最大价值.对于$k = 1, 2, ..., n$输出答案. ...
WEB入门四 CSS样式表深入
学习内容 Ø CSS选择器深入学习 Ø CSS继承 Ø CSS文本效果 Ø CSS图片效果能力目标 Ø 掌握CSS选择器的组合声 ...
解题：POI 2010 Beads
题面正反各做一遍哈希来判断,然后在两个哈希值里取一个$max/min$做哈希值,然后每次把子串们的哈希插进$set$里,最后统计集合大小,就可以优秀地在$O(nlog^2$ $n)$中出解了然后我 ...
python之旅：并发编程之多进程
一 multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大部分情况需要使用多进程.P ...

Dream------spark--spark集群的环境搭建

Dream------spark--spark集群的环境搭建的更多相关文章

随机推荐

热门专题