新手刚开始学习比较迷茫,参考下面,然后找相关资料学习

1 Spark基础篇  
    1.1 Spark生态和安装部署  
        在安装过程中,理解其基本操作步骤。  
        安装部署  
          Spark安装简介  
          Spark的源码编译  
          Spark Standalone安装  
          Spark Standalone HA安装  
          Spark应用程序部署工具spark-submit  
        Spark生态  
          Spark(内存计算框架)  
          SparkSteaming(流式计算框架)  
          Spark SQL(ad-hoc)  
          Mllib(Machine Learning)  
          GraphX(bagel将被取代)  
    1.2 Spark运行架构和解析  
        Spark的运行架构  
          基本术语  
          运行架构  
          Spark on Standalone运行过程  
          Spark on YARN 运行过程  
        Spark运行实例解析  
          Spark on Standalone实例解析  
          Spark on YARN实例解析

1.3 Spark的监控和调优  
        Spark的监控  
          Spark UI监控,默认端口是4040  
          Ganglia 监控,大数据监控开源框架  
        Spark调优  
          基础性调优方式  
    1.4 Spark编程模型       
        Spark的编程模型  
          Spark编程模型解析  
          RDD的特点、操作、依赖关系  
          Spark应用程序的配置  
        Spark编程实例解析  
          日志的处理  
    1.5 Spark Streaming原理       
          Spark流式处理架构  
          DStream的特点  
          Dstream的操作和RDD的区别  
          Spark Streaming的优化  
        Spark Streaming实例分析  
          常用的实例程序:  
                  文本实例  
                  Window操作  
                  网络数据处理  
    1.6 Spark SQL原理  
          Spark SQL的Catalyst优化器  
          Spark SQL内核  
          Spark SQL和Hive      
        Spark SQL的实例  
          Spark SQL的实例操作demo  
          Spark SQL的编程,需要网络上查找一些资源

2 中级篇  
    2.1 Spark的多语言编程   
        Spark的scala编程  
        Spark的Python编程(Java一定熟悉啦,不用多说了)  
           对应的应用程序实例,理解基本的处理模式。

2.2 Spark 机器学习入门  
        机器学习的原理  
        Mllib简介,实例分析  
    2.3 GraphX 入门  
        图论基础  
        GraphX的简介  
        GraphX例程分析  
    2.4 理解Spark与其它项目的区别和联系  
        Spark和MapReduce、Tez  
        Spark的衍生项目BlinkDB,RSpark  
    2.5 关注Spark的作者的blog和权威网站的文档

3 高级篇  
   3.1 深入理解Spark的架构和处理模式

3.2 Spark源码剖析与研读  
        Spark Core核心模块,  
        掌握下面核心功能的处理逻辑:  
            SparkContext   
            Executor  
            Deploy  
            RDD和Storage  
            Scheduler和Task  
        Spark Examples  
    3.3 思考如何优化和提升,掌握其优缺点,  
        深入思考能不能衍生出有意思的课题。

Spark学习体系整理(基础篇、中级篇、高级篇所涉及内容)的更多相关文章

  1. Spark学习体系

    底理解Spark,能够分为以下几个层次. 1 Spark基础篇 1.1 Spark生态和安装部署 在安装过程中,理解其基本操作步骤. 安装部署 Spark安装简单介绍 Spark的源代码编译 Spar ...

  2. #Java学习之路——基础阶段二(第二篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  3. #Java学习之路——基础阶段(第三篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  4. #Java学习之路——基础阶段二(第九篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  5. #Java学习之路——基础阶段二(第一篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  6. #Java学习之路——基础阶段(第十一篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  7. #Java学习之路——基础阶段(第十篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  8. #Java学习之路——基础阶段(第八篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

  9. #Java学习之路——基础阶段(第七篇)

    我的学习阶段是跟着CZBK黑马的双源课程,学习目标以及博客是为了审查自己的学习情况,毕竟看一遍,敲一遍,和自己归纳总结一遍有着很大的区别,在此期间我会参杂Java疯狂讲义(第四版)里面的内容. 前言: ...

随机推荐

  1. JavaScript高级程序设计-读书笔记(6)

    第20章 JSON JSON是一个轻量级的数据格式,可以简化表示复杂数据结构的工作量 JSON的语法可以表示一下三种类型的值 l        简单值:使用与JavaScript相同的语法,可以在JS ...

  2. C# WebSocket解析(收发数据包、分片超长包处理)

    using System; using System.Collections.Generic; using System.Linq; using System.Security.Cryptograph ...

  3. Centos 查看端口占用情况

    netstat -ntlp 把相应PID kill掉即可

  4. 从SynchronizedCollection说起

    SynchronizedCollection简介 SynchronizedCollection是Collections下所有现场安全集合的父类,并发安全集合可以分为三类,一种是比较老的实现,例如vec ...

  5. 前端要不要学数据结构&算法

    我们都知道前端开发工程师更多偏向 DOM 渲染和 DOM 交互操作,随之 Node 的推广前端工程师也可以完成服务端开发.对于服务端开发而言大家都觉得数据结构和算法是基础,非学不可.所以正在进行 No ...

  6. Django框架学习笔记(windows环境下安装)

    博主最近开始学习主流框架django 网上大部分的安装环境都linux的 由于博主在windows环境下已经有了 Pycharm编辑器 ,所以决定还是继续在windows环境下学习 首先是下载 链接 ...

  7. ZooKeeper原理 --------这可能是把ZooKeeper概念讲的最清楚的一篇文章

    相信大家对 ZooKeeper 应该不算陌生,但是你真的了解 ZooKeeper 是什么吗?如果别人/面试官让你讲讲 ZooKeeper 是什么,你能回答到哪个地步呢? 我本人曾经使用过 ZooKee ...

  8. [sqlite] 判断表、视图是否存在及常用C#操作语句

    1,判断表是否存在: SELECT name, sql FROM sqlite_master WHERE type="table" AND name = "Dom&quo ...

  9. Upgrade Bash on Ubuntu from 14.04 to 16.04

    过程 1 sudo -S apt-mark hold sudo sudo -S apt-mark hold procps sudo -S apt-mark hold strace 2 sudo do- ...

  10. Hrbust 1535 相爱

    Description 静竹在斐波那契的帮助下,渐渐的和数学相爱了.和数学在一起最有意思的就是它能够出一些特别有意思并且巧妙的题目让静竹来思考.这次也不例外,给静竹两个数a,b,又给出了加,减,乘,除 ...