Spark目录
1. Spark1.0.0 应用程序部署工具spark-submit
2. Spark Streaming的编程模型
3. 使用java api操作HDFS文件
4. 用SBT编译Spark的WordCount程序
5. 在Spark上运行TopK程序
6. 在Spark上运行WordCount程序
7. Spark一个简单案例
8. Spark源码分析
9. Spark SQL
10. HDFS常用命令
11. Spark SQL之调优
12. Spark调优
13. Spark学习视频整合
14. HDFS命令行工具
15. MapReduce调度器
16. 在Spark程序中使用压缩
17. Spark集群基于Zookeeper的HA搭建部署笔记(转)
18. 使用 Kafka 和 Spark Streaming 构建实时数据处理系统(转)
19. spark streaming 接收 kafka 数据java代码WordCount示例
20. Spark+Kafka的Direct方式将偏移量发送到Zookeeper实现(转)
21. 使用Spark读写CSV格式文件(转)
22. 在Spark中尽量少使用GroupByKey函数(转)
23. Spark应用程序运行的日志存在哪里(转)
24. Spark Streaming性能调优详解(转)
25. 在Spark中自定义Kryo序列化输入输出API(转)
26. Spark Streaming中空batches处理的两种方法(转)
27. 【采集层】Kafka 与 Flume 如何选择(转)
28. Spark RDD API扩展开发
29. Storm和Spark Streaming框架对比(转)
30. Spark源码分析:多种部署方式之间的区别与联系(转)
31. Spark入门实战系列--6.SparkSQL(上)--SparkSQL简介
32. sparkSQL1.1入门之一:为什么sparkSQL
33. Spark Streaming:大规模流式数据处理的新贵(转)
34. HBase系统架构及数据结构(转)
35. 错误Name node is in safe mode的解决方法 (转)
36. flume学习(三):flume将log4j日志数据写入到hdfs(转)
37. Spark中加载本地(或者hdfs)文件以及SparkContext实例的textFile使用
38. Spark从HDFS上读取JSON数据
39. Spark向HDFS中存储数据
40. Spark GraphX图处理编程实例
41. GraphX中Pregel单源点最短路径(转)
Spark亚太研究院系列丛书——Spark实战高手之路 从零开始_读书频道_51CTO.COM_领先的中文IT技术网站
http://book.51cto.com/art/201408/448416.htm
Spark目录的更多相关文章
- Spark运行模式与Standalone模式部署
上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...
- Spark on YARN的部署
Spark on YARN的原理就是依靠yarn来调度Spark,比默认的Spark运行模式性能要好的多,前提是首先部署好hadoop HDFS并且运行在yarn上,然后就可以开始部署spark on ...
- Spark快速入门 - Spark 1.6.0
Spark快速入门 - Spark 1.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 快速入门(Quick Start) 本文简单介绍了Spark的使用方式.首 ...
- 在 Azure HDInsight 中安装和使用 Spark
Spark本身用Scala语言编写,运行于Java虚拟机(JVM).只要在安装了Java 6以上版本的便携式计算机或者集群上都可以运行spark.如果您想使用Python API需要安装Python解 ...
- Mac 配置Spark环境scala+python版本(Spark1.6.0)
1. 从官网下载Spark安装包,解压到自己的安装目录下(默认已经安装好JDK,JDK安装可自行查找): spark官网:http://spark.apache.org/downloads.html ...
- 使用sbt构建spark 程序
今日在学习scala和spark相关的知识.之前在eclipse下编写了wordcount程序.但是关于导出jar包这块还是很困惑.于是学习sbt构建scala. 关于sbt的介绍网上有很多的资料,这 ...
- Windows下Spark单机环境配置
1. 环境配置 a) java环境配置: JDK版本为1.7,64位: 环境变量配置如下: JAVA_HOME为JDK安装路径,例如D:\software\workSoftware\JAVA 在pa ...
- spark on centos6.5 安装
第一步在centos 6.5上安装java 运行环境 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-18 ...
- Spark:利用Eclipse构建Spark集成开发环境
前一篇文章“Apache Spark学习:将Spark部署到Hadoop 2.2.0上”介绍了如何使用Maven编译生成可直接运行在Hadoop 2.2.0上的Spark jar包,而本文则在此基础上 ...
随机推荐
- linux 后台运行程序
有些时候,我们需要在终端启动一个程序,并使之运行--但是如果关闭终端,那么这个程序也就随着关闭了.那么有没有什么方法在关闭终端后,让已经从这个终端启动的程序继续运行呢? 前置知识: xterm,con ...
- erlang 常用函数
os:getpid() 获得erl.exe的进程表示符 application:start(appname, Type), Type == permanent 表示一个应用死了,其它应用全部死掉 ...
- Percona Xtrabackup备份mysql(转)
add by zhj:另外,参考了Xtrabackup之innobackupex备份恢复详解,我用的是Xtrabackup2.2.6版本, 可以成功备份和恢复指定的数据库. 原文:http://www ...
- Attach source code to a Netbeans Library Wrapper Module
http://rubenlaguna.com/wp/2008/02/22/attach-source-code-to-a-netbeans-library-wrapper-module/ Attach ...
- UVALive 3953 Strange Billboard (状态压缩+枚举)
Strange Billboard 题目链接: http://acm.hust.edu.cn/vjudge/contest/129733#problem/A Description The marke ...
- C#应用Newtonsoft.Json操作json[2]-反序列化不定类型
在读json时,有时不知道对方的数据类型是什么样的,本文用Newtonsoft,把json反序列化为List>,在某种情况下还是有用的. private static List<Dicti ...
- Cisco SDM
SDM连接方式:http+telnet / https+ssh 要使用SDM对CISCO设备实现集中式管理,必须在设备上键入如下命令: 步骤1: 要启用路由器的HTTP/HTTPS 服务器,请 ...
- socket发送和接收数据
1)sendBuf(),sendText(),sendStream() 几乎所有的通信控件都会提供上面的3个方法.首先看看SendBuf(). function TCustomWinSocket.Se ...
- [iOS微博项目 - 2.3] - 用户取消对app的授权
github: https://github.com/hellovoidworld/HVWWeibo A.用户取消对app的授权 用户可以在微博网站上取消对某个应用(app)的授权 1.打开& ...
- installshield basic msi 更新时覆盖不了上一个版本文件解决方案1
1.增加dll exe程序集的版本号 2.设置IS里文件的Set key file