Hadoop概念学习系列之谈hadoop/spark里为什么都有，YARN呢？（四十一）

　　在Hadoop集群里，有三种模式:

　　1、本地模式

　　2、伪分布模式

　　3、全分布模式

　　在Spark集群里，有四种模式：

1、local单机模式
　　结果xshell可见：
　　./bin/spark-submit --class org.apache.spark.examples.SparkPi --master local[1] ./lib/spark-examples-1.3.1-hadoop2.4.0.jar 100
　　这里写local，就是local[1]

2、standalone集群模式
　　需要的配置项
　　1, slaves文件
　　　　spark002
　　　　spark003
　　2, spark-env.sh
　　　　export JAVA_HOME=/usr/soft/jdk1.7.0_71
　　　　export SPARK_MASTER_IP=spark001
　　　　export SPARK_MASTER_PORT=7077
　　　　export SPARK_WORKER_CORES=1
　　　　export SPARK_WORKER_INSTANCES=1
　　　　export SPARK_WORKER_MEMORY=1g

3、standalone集群模式
　　之client模式：
　　结果xshell可见：
　　./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://spark001:7077 --executor-memory 1G --total-executor-cores 1 ./lib/spark-examples-1.3.1-hadoop2.4.0.jar 100

3、standalone集群模式
之cluster模式：
　　结果spark001:8080里面可见！
　　./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://spark001:7077 --deploy-mode cluster --supervise --executor-memory 1G --total-executor-cores 1 ./lib/spark-examples-1.3.1-hadoop2.4.0.jar 100
　　--supervise是进程监控

4、Yarn集群模式
　　需要的配置项
　　1, spark-env.sh
　　　　export HADOOP_CONF_DIR=$HADOOP_INSTALL/etc/hadoop
　　　　export YARN_CONF_DIR=$HADOOP_INSTALL/etc/hadoop
　　　　export SPARK_HOME=/usr/hadoopsoft/spark-1.3.1-bin-hadoop2.4
　　　　export SPARK_JAR=/usr/hadoopsoft/spark-1.3.1-bin-hadoop2.4/lib/spark-assembly-1.3.1-hadoop2.4.0.jar
　　　　export PATH=$SPARK_HOME/bin:$PATH
　　2, ~/.bash_profile
　　配置好hadoop环境变量

4、Yarn集群模式
client模式：
　　结果xshell可见：
　　./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client --executor-memory 1G --num-executors 1 ./lib/spark-examples-1.3.1-hadoop2.4.0.jar 100

4、Yarn集群模式
cluster模式：
　　结果spark001:8088里面可见！
　　./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster --executor-memory 1G --num-executors 1 ./lib/spark-examples-1.3.1-hadoop2.4.0.jar 100

　　hadoop/spark里为什么都有，YARN呢？

　　答：普通OS（操作系统）的功能主要是为处理器管理、存储器管理、设备管理、文件管理、作业管理和用户接口。

在集群环境下，HDFS已经负责了文件管理，而设备概念较弱，故YARN主要负责统一管理集群内服务器的计算资源（主要包括CPU和内存资源）、作业调度和用户接口。

Hadoop概念学习系列之谈hadoop/spark里为什么都有，YARN呢？（四十一）的更多相关文章

Hadoop概念学习系列之谈hadoop/spark里为什么都有，键值对呢？（四十）
很少有人会这样来自问自己?只知道,以键值对的形式处理数据并输出结果,而没有解释为什么要以键值对的形式进行. 包括hadoop的mapreduce里的键值对,spark里的rdd里的map等. 这是为什 ...
Hadoop概念学习系列之谈hadoop/spark里分别是如何实现容错性？（四十二）
Hadoop使用数据复制来实现容错性(I/O高) Spark使用RDD数据存储模型来实现容错性. RDD是只读的.分区记录的集合.如果一个RDD的一个分区丢失,RDD含有如何重建这个分区的相关信息. ...
Hadoop概念学习系列之为什么hadoop/spark执行作业时，输出路径必须要不存在？（三十九）
很多人只会,但没深入体会和想为什么要这样? 拿Hadoop来说,当然,spark也一样的道理. 输出路径由Hadoop自己创建,实际的结果文件遵守part-nnnn的约定. 如何指定一个已有目录作为H ...
Hadoop概念学习系列之Hadoop新手学习指导之入门需知（二十）
不多说,直接上干货! 零基础学习hadoop,没有想象的那么困难,也没有想象的那么容易.从一开始什么都不懂,到能够搭建集群,开发.整个过程,只要有Linux基础,虚拟机化和java基础,其实hadoo ...
Hadoop概念学习系列之Java调用Shell命令和脚本，致力于hadoop/spark集群（三十六）
前言说明的是,本博文,是在以下的博文基础上,立足于它们,致力于我的大数据领域! http://kongcodecenter.iteye.com/blog/1231177 http://blog.cs ...
Hadoop概念学习系列之Hadoop、Spark学习路线（很值得推荐）（十八）
不多说,直接上干货! 说在前面的话此笔,对于仅对于Hadoop和Spark初中学者.高手请忽略! 1 Java基础: 视频方面: 推荐<毕向东JAVA基础视频教程>.学 ...
Hadoop概念学习系列之Hadoop、Spark学习路线（很值得推荐）
说在前面的话此笔,对于仅对于Hadoop和Spark初中学者.高手请忽略! 1 Java基础: 视频方面: 推荐<毕向东JAVA基础视频教程>.学习hadoop不需要过 ...
Hadoop概念学习系列之Hadoop、Spark学习路线
1 Java基础: 视频方面: 推荐<毕向东JAVA基础视频教程>.学习hadoop不需要过度的深入,java学习到javase,在Java虚拟机的内存管理.以及多线程. ...
Hadoop概念学习系列之如何去找到历史版本的Hadoop发行包（三十四）
如何去找到历史版本的Hadoop发行包找到Hadoop历史版本这里我需要的Hadoop版本是2.0.3.打开hadoop的下载页面 http://www.apache.org/dyn/closer ...

随机推荐

mybatis下的分页，支持所有的数据库
大家都知道,mybatis的自带分页方法只是逻辑分页,如果数据量很大,内存一定会溢出,不知道为什么开源组织不在里面集成hibernate的物理分页处理方法!在不修改mybatis源代码的情况下, 应 ...
java-冒泡排序、选择排序、二分查找
1.冒泡排序 public void bubbleSort(int[] arr) { for (int i = 0; i < arr.length - 1; i++) { //外循环只需要比较a ...
《DSP using MATLAB》Problem 5.2
代码: %% ---------------------------------------------------------------------------------- %% Output ...
linux---三剑客
linux的三剑客分别为awk/sed/grep,是运维人员必不可少的常用命令. 一:awk取列 awk ‘{print $1 “ ” $2}’ old.txt awk /aaa/ old.txt 二 ...
doc 常用命令
★ 查看java环境变量 echo %JAVA_HOME% echo %PATH% echo %CLASSPATH%
Go Example--关闭通道
package main import ( "fmt" ) func main() { jobs := make(chan int, 5) done := make(chan bo ...
day09 MapReduce
, PS:上图为MapReduce原理全解剖, 图上带红色标识的部分是能够自定义的1.首先要解决读文件的问题. mapTask中有个read()方法,专门负责读取键值对,而且是整行整行的读2.在读好文 ...
每天进步一点点- 资源与URI（吐血精华总结）
1.资源(Resources) 每一个URI代表一种资源这句话的理解 ***************************************************************** ...
OpenGL编程-OpenGL框架-win32项目
在win32项目中开发的程序小知识: 控制台应用程序运行就是dos的界面项目一般采用了可视化开发开发出来的东西就像QQ之类的是有窗口界面的程序运行结果是这样的源代码:对第45行进行覆盖 # ...
MySQL Session--批量KILL会话
使用SELECT INTO OUTFILE+SOURCE批量KILL ## 查看kill_id文件是否存在 SYSTEM cat /tmp/kill_id.sql ## 如果文件存在,则先删除 sys ...

Hadoop概念学习系列之谈hadoop/spark里为什么都有，YARN呢？（四十一）

Hadoop概念学习系列之谈hadoop/spark里为什么都有，YARN呢？（四十一）的更多相关文章

随机推荐

热门专题