Spark1.0.0 学习路径
作为一个骨灰级的老IT,经过非常成一段时间的消沉,再次被点燃激情,决定近几年内投入Spark的队伍。去见证Spark的不断强大。在最初的阶段,将作为Spark的布道者,宣传和介绍Spark,最终将选择某一个方向,深入研究和编写代码。
,看看这几天股市中软件股的表现。能够预见,在今后非常长一段时间内,开源软件将越来越受到重视。作为大数据处理平台的开源软件Spark,因为其一体化的解决方式、高效的代码编写速度、快速的计算能力,将不断在大数据阵营中脱颖而出。为了方便很多其它新手投入Spark队伍,笔者将自己的学习经验整理了一下,陆陆续续地以博客形式公布出来,计划60篇左右。尽量在8月底完毕,同一时候也是自己对所学的内容加以沉淀。
- 官方下载地址:http://spark.apache.org/downloads.html
- 当中Spark1.0.0 for hadoop2的直接下载地址:http://d3kbcqa49mib13.cloudfront.net/spark-1.0.0-bin-hadoop2.tgz
- 源码的直接下载地址:http://d3kbcqa49mib13.cloudfront.net/spark-1.0.0.tgz
- 自编译的部署包:百度盘 (pan.baidu.com) /s/1dDmqK4h#dir/path=%2Fdeploy
- spark-1.0.0-bin-2.2.0.tgz是基于hadoop2.2.0的安装部署包
- spark-1.0.0-techyon-bin-2.2.0.tgz是基于hadoop2.2.0和techyon0.41的安装部署包
- spark-assembly-1.0.0-hadoop2.2.0.jar是基于hadoop2.2.0的Spark1.0.0应用程序开发包
每周周末会更新下图。做了标记的是已经完毕的,没作标记的是计划写的或是要准备更新当中内容的,要更新的是曾经写的基于Spark1.0.0-SNAPSHOT的博客;同一时候也会更新以下的博客链接。博客中涉及的实验和代码都是基于Spark1.0.0开发环境高速搭建一文中实验环境。
- RDD 细解
- Spark RDD
- Spark Streaming RDD
- Spark SQL RDD
- MLLib RDD
- GraphX RDD
- DAG Scheduler 细解
- Task Scheduler 细解
- Spark1.0.0 Standalone 执行架构实例解析
- Spark1.0.0 on YARN 执行架构实例解析
- Spark1.0.0 on Mesos 执行原理解析
- Spark1.0.0 编程模型解析
Spark Streaming执行架构基本概念
- Spark1.0.0 源代码编译和部署包生成
- Spark1.0.0 on YARN 模式部署
- Spark1.0.0 on Mesos 模式部署
- Spark1.0.0 Standalone模式部署
- Spark1.0.0 Standalone HA实现
- Spark1.0.0属性配置
- Spark1.0.0环境变量配置
- Spark1.0.0日志配置
- Spark1.0.0 history server 配置
- Spark1.0.0 job server配置
- Spark1.0.0应用提交工具spark-submit
- Spark1.0.0交互工具spark-shell
- Spark1.0.0 UI监控解读
- 用ganglia监控Spark1.0.0
- Spark1.0.0 的一些小经验
- Spark1.0.0 性能调优
Spark SQL 简单介绍
Spark MLlib 简单介绍
Spark GraphX 简单介绍
BlinkDB 简单介绍
SparkR 简单介绍
Spark1.0.0 和 Hbase
Spark1.0.0 和 RDBMS
SparkStreaming 和 flume
Spark SQL和hive
历史数据和实时数据分析
欺诈检測
推荐系统
spark-submit 源代码分析
RDD 解读
DAG Schedule 解读
Task Scheduler 解读
Spark AKKA 解读
Spark log4j 解读
版权声明:本文博主原创文章,博客,未经同意不得转载。
Spark1.0.0 学习路径的更多相关文章
- spark1.1.0学习路线
经过一段时间授课,积累下不少的spark知识.想逐步汇总成资料,分享给小伙伴们.对于想视频学习的小伙伴,能够訪问炼数成金站点的<spark大数据平台>课程.每周的课程是原理加实 ...
- Spark1.0.0 学习路线指导
转自:http://www.aboutyun.com/thread-8421-1-1.html 问题导读1.什么是spark?2.spark编程模型是什么?3.spark运维需要具有什么知识?4.sp ...
- Apache Spark1.1.0部署与开发环境搭建
Spark是Apache公司推出的一种基于Hadoop Distributed File System(HDFS)的并行计算架构.与MapReduce不同,Spark并不局限于编写map和reduce ...
- Spark-1.0.0 standalone分布式安装教程
Spark目前支持多种分布式部署方式:一.Standalone Deploy Mode:二Amazon EC2.:三.Apache Mesos:四.Hadoop YARN.第一种方式是单独部署,不需要 ...
- Spark1.0.0 开发环境高速搭建
在本系列博客中.为了解析一些概念.解析一些架构.代码測试.搭建了一个实验平台.例如以下图所看到的: 本实验平台是在一台物理机上搭建的.物理机的配置是16G内存,4核8线程CPU ...
- 【nodejs学习】0.nodejs学习第一天
1.模块 大一点的程序都需要模块化,nodejs也不例外,代码放到不同的文件中,每一个文件就可以是一个模块,文件路径名就是一个模块名.每个模块中包含三个预先定义的变量: 1.require:用于在当前 ...
- Spark1.0.0 分布式环境搭建
软件版本号例如以下: Hostname IP Hadoop版本号 Hadoop 功能 系统 master 192.168.119.128 1.1.2 namenode jdk1.6+hadoop+sc ...
- Spark1.0.0 属性配置
1:Spark1.0.0属性配置方式 Spark属性提供了大部分应用程序的控制项,而且能够单独为每一个应用程序进行配置. 在Spark1.0.0提供了3种方式的属性配置: Sp ...
- Spark1.0.0属性配置
1:Spark1.0.0属性配置方式 Spark属性提供了大部分应用程序的控制项,并且可以单独为每个应用程序进行配置. 在Spark1.0.0提供了3种方式的属性配置: SparkConf方式 Spa ...
随机推荐
- 染色法判断是否是二分图 hdu2444
用染色法判断二分图是这样进行的,随便选择一个点, 1.把它染成黑色,然后将它相邻的点染成白色,然后入队列 2.出队列,与这个点相邻的点染成相反的颜色 根据二分图的特性,相同集合内的点颜色是相同的,即 ...
- Gitclient使用
1 首次安装gitclient msysgit watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY3h4NTA0NjU5OTg3/font/5a6L5L2T/ ...
- Matlab绘图-很详细,很全面
强大的绘图功能是Matlab的特点之一,Matlab提供了一系列的绘图函数,用户不需要过多的考虑绘图的细节,只需要给出一些基本参数就能得到 所需图形,这类函数称为高层绘图函数.此外,Matlab还提供 ...
- 【iOS开发-22】navigationBar导航栏,navigationItem建立:获取导航栏中的基本文本和button以及各种跳跃
(1)navigationBar导航栏可以被看作是self.navigationController一个属性导航控制器,它可以由点直接表示self.navigationController.navig ...
- Test SRM Level One: TemperatureScales
题目来源:http://community.topcoder.com/stat?c=problem_statement&pm=6038 因为TopCoder SRM比赛使用的编译器进行了升级, ...
- JS判断用户连续输入
方案1 // // $('#element').donetyping(callback[, timeout=1000]) // Fires callback when a user has finis ...
- 无法识别的属性“targetFramework”。请注意,属性名是大写和小写。错误的解决方案
"/CRM"应用server错. 配置错误 说明: 在处理向该请求提供服务所需的配置文件时出错.请检查以下的特定错误具体信息并适当地改动配置文件. 分析器错误消息: 无法识别的属性 ...
- js操作string它substr方法
substr 方法 从指定的指定起始位置的长度返回一个子. stringvar.substr(start [, length ]) 參数 stringvar 必选项. 要提取子字符串的字符串文字或 S ...
- UIScrollViewA都PI得知。
//1.设定滚定条的样式 typedef NS_ENUM(NSInteger, UIScrollViewIndicatorStyle) { UIScrollViewIndicatorStyleDefa ...
- Java应用中使用ShutdownHook友好地清理现场(转)
在线上Java程序中经常遇到进程程挂掉,一些状态没有正确的保存下来,这时候就需要在JVM关掉的时候执行一些清理现场的代码.Java中得ShutdownHook提供了比较好的方案. JDK在1.3之后提 ...