非常好的spark分析博客，我们team的，哈哈：http://jerryshao.me/

spark programming guide:

https://github.com/mesos/spark/wiki/Spark-Programming-Guide

-------------------------------------------------------------

scala安装：

$ wget http://www.scala-lang.org/files/archive/scala-2.9.3.tgz
$ tar xvfz scala-2.9.3.tgz

~/.bashrc中添加：

export SCALA_HOME=/usr/scala/scala-2.9.3
export PATH=$PATH:$SCALA_HOME/bin

-------------------------------------------------

编译：
SPARK_HADOOP_VERSION=1.2.1 sbt/sbt assembly

需要安装hadoop

Spark Standalone Mode安装

主机：
192.168.56.103
从机：
192.168.56.102
192.168.56.103

conf/spark-env.sh

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64/

export SCALA_HOME=/usr/local/src/scala-2.9.3/

export SPARK_MASTER_IP=192.168.56.103

export SPARK_MASTER_WEBUI_PORT=8080

export SPARK_WORKER_WEBUI_PORT=8081  

export SPARK_WORKER_CORES=1

export SPARK_WORKER_MEMORY=512m

conf/slaves

# A Spark Worker will be started on each of the machines listed below.

192.168.56.102

192.168.56.103

　　主机和从机的这两个文件是一样的，之后再主机上执行：

 bin/start-all.sh

然后测试是否开启成功：

主机jps：

8787 Worker

3017 NameNode

9366 Jps

3728 TaskTracker

8454 Master

2830 DataNode

2827 SecondaryNameNode

3484 JobTracker

从机jps：

6649 Worker

2592 DataNode

2997 TaskTracker

7105 Jps

webUI：

（主机master，可以查看各个worker的工作状态） http://localhost:8080/

运行例子：

在主机上：

./run-example org.apache.spark.examples.SparkPi spark://192.168.56.103:7077

./run-example org.apache.spark.examples.SparkLR spark://192.168.56.103:7077



Mesos部署Spark
。。。

----------------------------------------------
去中心化调度器（sparrow）：

http://www.binospace.com/index.php/sparrow-sosp13-an-accelerated-short-job-scheduling-method/

Spark相关的更多相关文章

hadoop和spark相关参数的配置
背景 MapReduce和Spark对外提供了上百个配置参数,用户可以为作业定制这些参数以更快,更稳定的运行应用程序.本文梳理了最常用的一些MapReduce和Spark配置参数. MapReduce ...
spark相关脚本解析
spark-shell/spark-submit/pyspark等关系如下: #spark-submit 逻辑: ########################################### ...
Spark相关下载
HBase: http://hbase.apache.org/ Hadoop hadoop.apache.org spark http://spark.apache.org/
Spark相关错误汇总
前面介绍了Spark开发环境的搭建,下面将在实际开发过程中遇到的一些问题汇总一下: 1.Exception in thread "main" com.typesafe.config ...
Hadoop/Spark相关面试问题总结
面试回来之后把其中比较重要的问题记了下来写了个总结: (答案在后面) 1.简答说一下hadoop的map-reduce编程模型 2.hadoop的TextInputFormat作用是什么,如何自定义实 ...
spark 相关
Spark为什么会比mapreduce快? 1.Spark减少了中间过程的磁盘读写,数据很多时候不需要落地,从而提升了效率. 2.Spark基于内存的读写,减少了磁盘IO.node数据交互的通信时间. ...
spark相关介绍-提取hive表（一）
本文环境说明 centos服务器 jupyter的scala核spylon-kernel spark-2.4.0 scala-2.11.12 hadoop-2.6.0 本文主要内容 spark读取hi ...
Spark相关知识点（一）
spark工作机制,哪些角色,作用. spark yarn模式下的cluster模式和client模式有什么区别.
Hadoop相关日常操作
1.Hive相关脚本导数据,并设置运行队列 bin/beeline -u 'url' --outputformat=tsv -e "set mapreduce.job.queuename= ...

随机推荐

ios导航器跳转动画
出栈或压栈简单实现动画 CATransition *animation1=[CATransition animation];//类方法创建一个切换对象 animation1.duratio ...
jar包的MANIFEST.MF注意事项
1. 基本格式属性名称:空格+属性值 2. 一行最多72个字符,换行继续必须以空格开头 3. 文件最后必须要有一个回车换行 4. Class-Path 当前路径是jar包所在目录,如果要引用当前目录 ...
js toString()
日志管理-Log4net
引言 log4net库是Apache log4j框架在Micorsoft.NET平台的实现,是一个帮组程序员将日志信息输出到各种目标(控制台.文件.数据库等)的工具.(百度百科) 实际项目中使用log ...
nvm诡异的报错
安装:curl -o- https://raw.githubusercontent.com/creationix/nvm/v0.33.0/install.sh | bash wget -qO- htt ...
JqGrid自定义的列
$("#gridTable").jqGrid({ //...其它属性 colModel: [ //...其它列 { name: 'dsource_alarm', index: 'd ...
Angular通过CORS实现跨域方案
以前有一篇很老的文章网上转了很多,包括现在如果你百度"跨域"这个关键字,前几个推荐的都是"Javascript跨域总结与解决方案".看了一下感觉手段有点陈旧了, ...
C语言数据类型取值范围
一.获取数据类型在系统中的位数在不同的系统中,数据类型的字节数(bytes)不同,位数(bits)也有所不同,那么对应的取值范围也就有了很大的不同,那我们怎么知道你当前的系统中C语言的某个数据类型的 ...
MWeb 1.5 发布！增加打字机滚动模式、发布到 Evernote、印象笔记、Wordpress.com、Blogger、编辑器内代码块语法高亮
打字机滚动模式(Typewriter Scrolling) 快捷键:CMD + Option + T,菜单:View - Typewriter Scrolling ,效果如下图: 发布到 Everno ...
用android去写一个小程序
前言: 软工的一个小作业:实现"黄金分割小游戏", 需要结对编程,队友:陈乐云共用时两天. 早期思路设计: 采用键值对的形式,以Map作为存储结构.优点:能够将数据与用户对 ...

Spark相关

Spark Standalone Mode安装

Spark相关的更多相关文章

随机推荐

热门专题