1. Spark1.0.0 应用程序部署工具spark-submit

2. Spark Streaming的编程模型

3. 使用java api操作HDFS文件

4. 用SBT编译Spark的WordCount程序

5. 在Spark上运行TopK程序

6. 在Spark上运行WordCount程序

7. Spark一个简单案例

8. Spark源码分析

9. Spark SQL

10. HDFS常用命令

11. Spark SQL之调优

12. Spark调优

13. Spark学习视频整合

14. HDFS命令行工具

15. MapReduce调度器

16. 在Spark程序中使用压缩

17. Spark集群基于Zookeeper的HA搭建部署笔记(转)

18. 使用 Kafka 和 Spark Streaming 构建实时数据处理系统(转)

19. spark streaming 接收 kafka 数据java代码WordCount示例

20. Spark+Kafka的Direct方式将偏移量发送到Zookeeper实现(转)

21. 使用Spark读写CSV格式文件(转)

22. 在Spark中尽量少使用GroupByKey函数(转)

23. Spark应用程序运行的日志存在哪里(转)

24. Spark Streaming性能调优详解(转)

25. 在Spark中自定义Kryo序列化输入输出API(转)

26. Spark Streaming中空batches处理的两种方法(转)

27. 【采集层】Kafka 与 Flume 如何选择(转)

28. Spark RDD API扩展开发

29. Storm和Spark Streaming框架对比(转)

30. Spark源码分析:多种部署方式之间的区别与联系(转)

31. Spark入门实战系列--6.SparkSQL(上)--SparkSQL简介

32.  sparkSQL1.1入门之一:为什么sparkSQL

33. Spark Streaming:大规模流式数据处理的新贵(转)

34. HBase系统架构及数据结构(转)

35. 错误Name node is in safe mode的解决方法 (转)

36. flume学习(三):flume将log4j日志数据写入到hdfs(转)

37. Spark中加载本地(或者hdfs)文件以及SparkContext实例的textFile使用

38. Spark从HDFS上读取JSON数据

39. Spark向HDFS中存储数据

40. Spark GraphX图处理编程实例

41. GraphX中Pregel单源点最短路径(转)

Spark亚太研究院系列丛书——Spark实战高手之路 从零开始_读书频道_51CTO.COM_领先的中文IT技术网站
http://book.51cto.com/art/201408/448416.htm

Spark目录的更多相关文章

  1. Spark运行模式与Standalone模式部署

    上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

  2. Spark on YARN的部署

    Spark on YARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop HDFS并且运行在yarn上,然后就可以开始部署spark on ...

  3. Spark快速入门 - Spark 1.6.0

    Spark快速入门 - Spark 1.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 快速入门(Quick Start) 本文简单介绍了Spark的使用方式.首 ...

  4. 在 Azure HDInsight 中安装和使用 Spark

    Spark本身用Scala语言编写,运行于Java虚拟机(JVM).只要在安装了Java 6以上版本的便携式计算机或者集群上都可以运行spark.如果您想使用Python API需要安装Python解 ...

  5. Mac 配置Spark环境scala+python版本(Spark1.6.0)

    1. 从官网下载Spark安装包,解压到自己的安装目录下(默认已经安装好JDK,JDK安装可自行查找): spark官网:http://spark.apache.org/downloads.html ...

  6. 使用sbt构建spark 程序

    今日在学习scala和spark相关的知识.之前在eclipse下编写了wordcount程序.但是关于导出jar包这块还是很困惑.于是学习sbt构建scala. 关于sbt的介绍网上有很多的资料,这 ...

  7. Windows下Spark单机环境配置

    1. 环境配置 a)  java环境配置: JDK版本为1.7,64位: 环境变量配置如下: JAVA_HOME为JDK安装路径,例如D:\software\workSoftware\JAVA 在pa ...

  8. spark on centos6.5 安装

    第一步在centos 6.5上安装java 运行环境 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-18 ...

  9. Spark:利用Eclipse构建Spark集成开发环境

    前一篇文章“Apache Spark学习:将Spark部署到Hadoop 2.2.0上”介绍了如何使用Maven编译生成可直接运行在Hadoop 2.2.0上的Spark jar包,而本文则在此基础上 ...

随机推荐

  1. 以Akka为示例,介绍Actor模型

    许多开发者在创建和维护多线程应用程序时经历过各种各样的问题,他们希望能在一个更高层次的抽象上进行工作,以避免直接和线程与锁打交道.为了帮助这些开发者,Arun Manivannan编写了一系列的博客帖 ...

  2. LeetCode(1) -Two Sum

    题目要求很简单,给你一个数组(例如,nums = [2,7,11,15])和一个target(target = 9),找到数组里两个数相加后能得到target的这两个数的index.在本例中,返回的应 ...

  3. Django 1.6 最佳实践: django项目的服务器自动化部署(转)

    原文:http://www.weiguda.com/blog/41/ 当我们设置服务器时, 不应该每次都使用ssh登录服务器, 再按照记忆一步一步的配置. 因为这样实在是太容易忘记某些步骤了. 服务器 ...

  4. Clean Code第二章<命名>

    1.命名要有意义 错误写法 正确写法 2.某些构造函数可以提供有意义的静态方法去实现

  5. HD1064Financial Management

    Problem Description Larry graduated this year and finally has a job. He's making a lot of money, but ...

  6. OpenGL复习要点

    [OpenGL要点复习] 1.和像素有关的信息(例如像素的颜色)组织成位平面 (bitplane)的形式,位平面又可以组织成帧缓冲区(framebuffer)的形式.位平面是一块内存区域,保存了屏幕上 ...

  7. hdu 1045 Fire Net(最小覆盖点+构图(缩点))

    http://acm.hdu.edu.cn/showproblem.php?pid=1045 Fire Net Time Limit:1000MS     Memory Limit:32768KB   ...

  8. POJ2947Widget Factory(高斯消元解同模方程)

    http://poj.org/problem?id=2947 题目大意:有n 种装饰物,m 个已知条件,每个已知条件的描述如下:p start enda1,a2......ap (1<=ai&l ...

  9. [Oracle]配置path使oracle备份/导入数据命令exp/imp起作用

    将E:\Oracle11g\app\Administrator\product\11.2.0\dbhome_1\bin;路径添加如path

  10. hdoj 5400 Arithmetic Sequence

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5400 水题 #include<stdio.h> typedef long long LL; ...