Storm流计算之项目篇(Storm+Kafka+HBase+Highcharts+JQuery,含3个完整实际项目)
1.1、课程的背景
Storm是什么? 为什么学习Storm? Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等, 大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Storm更是流计算技术中的佼佼者和主流。 按照storm作者的说法,Storm对于实时计算的意义类似于Hadoop对于批处理的意义。Hadoop提供了map、reduce原语,使我们的批处理程序变得简单和高效。 同样,Storm也为实时计算提供了一些简单高效的原语,而且Storm的Trident是基于Storm原语更高级的抽象框架,类似于基于Hadoop的Pig框架, 让开发更加便利和高效。本课程会深入、全面的讲解Storm,并穿插企业场景实战讲述Storm的运用。 淘宝双11的大屏幕实时监控效果冲击了整个IT界,业界为之惊叹的同时更是引起对该技术的探索。 学完本课程你可以自己开发升级版的“淘宝双11”,还等什么?
Storm在大数据领域的影响已经不用多说,大数据实时性计算已经是发展趋势。目前在各大互联网、电商、电信、金融业等领域,Storm已经功不可没,被广泛应用在精准推荐、即时搜索、网站分析、监控告警、高频交易等领域。
本课程完全呈现企业实际项目,具有如下五大亮点和七大目标:
五大亮点:
、课程中完整开发3个Storm项目,均为企业实际项目,其中一个是完全由Storm Trident开发。
项目源码均可以直接运行,也可直接用于商用或企业。
、每个技术均采用最新稳定版本,学完后会员可以从Kafka到Storm项目开发及HighCharts图表开发一个人搞定!让学员身价剧增!
、搭建CDH5生态环境完整平台,且采用Cloudera Manager界面化管理CDH5平台。让Hadoop平台环境搭建和维护都变得轻而易举。
、分享实际项目的架构设计、优劣分析和取舍、经验技巧,陡直提升学员的经验值。
、学习完此课程,学员完全具备追求IT行业高薪的能力。
七大目标:
、全面掌握Storm完整项目开发思路和架构设计
、掌握Storm Trident项目开发模式
、掌握Kafka运维和API开发、与Storm接口开发
、掌握HighCharts各类图表开发和实时无刷新加载数据
、熟练搭建CDH5生态环境完整平台
、灵活运用HBase作为外部存储
、可以做到以一己之力完成从后台开发(Storm、Kafka、Hbase开发)到前台HighCharts图表开发、Jquery运用等,所有工作一个人搞定!
就是说可以一个人搞定淘宝双11大屏幕项目!
、Storm应用前景和课程大纲介绍
、CDH5搭建之CM5安装部署
、CDH5搭建和CM界面化集群管理
、Hadoop、HBase、Zookeeper集群管理和角色分配
、Kafka基础知识和集群搭建
、Kafka基本操作和最优设置
、Kafka Java API 简单开发测试
、storm-kafka 详解和实战案例
、JS图表框架HighCharts介绍
、HBase 快速入门
、基于HBase的Dao基类和实现类开发一
、基于HBase的Dao基类和实现类开发二
、【项目1-地区销售额】需求分析和架构设计
项目1主要技术点:
后台开发架构设计
前台开发架构设计
前后端数据实时交互
HighCharts图表开发
图表秒级无刷新实时展示
3D柱图、条形图、柱子图展示效果
、【项目1-地区销售额】Spout融合Kafka Consumer及线程安全测试
、【项目1-地区销售额】Bolt业务逻辑处理一
、【项目1-地区销售额】优化Bolt支持重启及结果数据核查
、【项目1-地区销售额】HighCharts图表开发一及Web端架构设计
、【项目1-地区销售额】HTTP长链接实现实时推送
、【项目1-地区销售额】HighCharts图表开发二及jquery运用
、【项目1-地区销售额】Web端完善和细节优化
、【项目1-地区销售额】项目发布及总结
、【项目2-省份销售排行】项目需求分析和分区Trident Spout开发
项目2为完全Storm Trident开发项目,主要技术点:
采用双纵轴图表展示效果
Storm Trident开发
采用Storm事务处理
基于Hbase的Trident State
DRPC分布式远程调用
TopN,前N排行
、【项目2-省份销售排行】Trident 代码开发一
、【项目2-省份销售排行】Trident 代码开发二
、【项目2-省份销售排行】基于HBase存储的State运用
、【项目2-省份销售排行】双纵轴HighCharts图表开发一
、【项目2-省份销售排行】双纵轴HighCharts图表开发二
、【项目2-省份销售排行】双纵轴HighCharts图表开发三
、【项目2-省份销售排行】前台和图表交互开发和Top N实现
、【项目2-省份销售排行】Top N展示优化和项目总结
-40讲为【项目3-网站User Views数】内容,该项目会继续增加难度,
展示图形为仿股票走势图的UV数实时分时走势图。
Storm流计算之项目篇(Storm+Kafka+HBase+Highcharts+JQuery,含3个完整实际项目)的更多相关文章
- Storm流计算从入门到精通之技术篇(高并发策略、批处理事务、Trident精解、运维监控、企业场景)
1.Storm全面.系统.深入讲解,采用最新的稳定版本Storm 0.9.0.1 : 2.注重实践,对较抽象难懂的技术点如Grouping策略.并发度及线程安全.批处理事务.DRPC.Storm ...
- 大数据开发实战:Storm流计算开发
Storm是一个分布式.高容错.高可靠性的实时计算系统,它对于实时计算的意义相当于Hadoop对于批处理的意义.Hadoop提供了Map和Reduce原语.同样,Storm也对数据的实时处理提供了简单 ...
- 实时流计算、Spark Streaming、Kafka、Redis、Exactly-once、实时去重
http://lxw1234.com/archives/2018/02/901.htm
- 《Kafka Stream》调研:一种轻量级流计算模式
原文链接:https://yq.aliyun.com/articles/58382 摘要: 流计算,已经有Storm.Spark,Samza,包括最近新起的Flink,Kafka为什么再自己做一套流计 ...
- Storm概念学习系列之什么是实时流计算?
不多说,直接上干货! 什么是实时流计算? 1.实时流计算背景 2.实时计算应用场景 3.实时计算处理流程 4.实时计算框架 什么是实时流计算? 所谓实时流计算,就是近几年由于数据得到广泛应用之后 ...
- Storm 流式计算框架
1. 简介 是一个分布式, 高容错的 实时计算框架 Storm进程常驻内存, 永久运行 Storm数据不经过磁盘, 在内存中流转, 通过网络直接发送给下游 流式处理(streaming) 与 批处理( ...
- Storm分布式实时流计算框架相关技术总结
Storm分布式实时流计算框架相关技术总结 Storm作为一个开源的分布式实时流计算框架,其内部实现使用了一些常用的技术,这里是对这些技术及其在Storm中作用的概括介绍.以此为基础,后续再深入了解S ...
- Storm实时计算:流操作入门编程实践
转自:http://shiyanjun.cn/archives/977.html Storm实时计算:流操作入门编程实践 Storm是一个分布式是实时计算系统,它设计了一种对流和计算的抽象,概念比 ...
- 分布式流式处理框架:storm简介 + Storm术语解释
简介: Storm是一个免费开源.分布式.高容错的实时计算系统.它与其他大数据解决方案的不同之处在于它的处理方式.Hadoop 在本质上是一个批处理系统,数据被引入 Hadoop 文件系统 (HDFS ...
随机推荐
- 设计模式(一)工厂模式Factory(创建型)
设计模式一 工厂模式Factory 在面向对象编程中, 最通常的方法是一个new操作符产生一个对象实例,new操作符就是用来构造对象实例的.可是在一些情况下, new操作符直接生成对象会带来一些问题. ...
- HDU 3068 最长回文 【最长回文子串】
和上一题一样,不过这题只是要求最长回文子串的长度 在此采用了非常好用的Manacher算法 据说还是O(n) 的效率QAQ 详细用法参考了上篇博客的参考资料,这两天有空学习一下~ Source cod ...
- iOS中NSString转换成HEX(十六进制)-NSData转换成int
http://www.2cto.com/kf/201402/281501.html 1 2 3 4 5 6 NSString *str = @"0xff055008"; //先以1 ...
- bresenham算法的FPGA的实现1
接着上一篇的 计算实现给出屏幕上任意两个点,求出这两个点之间直线上的所有的点.http://www.cnblogs.com/sepeng/p/4042464.html 这种直接算法的确是被鄙视了 强大 ...
- int_float_double数据类型的存储格式。
一段用来检测编辑器存储方式的程序 //date : 2013/8/16 //designer :pengxiaoen //function check the C programmable langu ...
- 查看linux下各数据类型的大小
代码如下: #include<stdio.h> int main() { printf("int:%d bytes\n",sizeof(int)); printf(&q ...
- 自定义Log4cpp的日志输出格式
// 1. 实例化一个PatternLayout对象 log4cpp::PatternLayout* pLayout = new log4cpp::PatternLayout(); // 2. 实例化 ...
- 3522: [Poi2014]Hotel( 树形dp )
枚举中点x( 即选出的三个点 a , b , c 满足 dist( x , a ) = dist( x , b ) = dist( x , c ) ) , 然后以 x 为 root 做 dfs , 显 ...
- CentOS6.5 配置防火墙+允许指定ip访问端口
参考博文: iptables防火墙只允许指定ip连接指定端口.访问指定网站 一.配置防火墙 打开配置文件 [root@localhost ~]# vi /etc/sysconfig/iptables ...
- SED修改指定行
一个文件:cat aa #如果第三行是5的话将改为8,很明显第三行是5所以 结果改变 [root@remote ~]# sed -e '3s/5/8/' aa [root@remote ~]# #如果 ...