大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP

- 系统管理员、运维经理、开发人员
- 涉及到大数据处理的数据中心运行、规划、设计等相关人员
========================================================================
4月上海开班时间:
管理员(4月1-4日)Cloudera Certified Administrator For Apache Hadoop;
开发者(4月23-26日)Cloudera Certifed Developer For Spark And Hadoop;
【其他课程安排请咨询】15601685012(小工老师)
QQ群:Cloudera大数据培训 308453209
课程内容:
【Cloudera Certified Administrator For Apache Hadoop 管理员课程】
课时:4天
学习系统管理的概念和Apache Hadoop的最佳实践;
从安装和配置到负载均衡和调优;
这个4天的的课程通过动手时间来赋予你部署的经验;
以及更多的安全方面的经验和故障排除;
课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试,可以代理报名;
【课程内容】
1、Hadoop分布式文件系统(HDFS)
2、YARN/MapReduce的工作原理
3、如何优化Hadoop机群所需要的硬件配置
4、搭建Hadoop机群所需要考虑的网络因素
5、Hadoop机群维护和控制
6、如何利用Hadoop配置选项进行系统性能调优
7、如何利用FairScheduler为多用户提供服务级别保障
8、Hadoop机群维护和监控
9、如何使用Flume从动态生成的文件加载到Hadoop
10、如何使用Sqoop从关系型数据加载数据
11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)
【学员基础】
具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。
【授课形式】
案例教学+上机实践
【Cloudera Certifed Developer For Spark And Hadoop 开发者课程】
课时:4天
学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,
讨论为更大型的工作流程而设计技术。
这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。
程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。
【课程内容】
1、MapReduce与HDFS内核知识以及如何编写MapReduce程序
2、Hadoop开发的最佳实践,调试、实现工作流及通用算法
3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件
4、按需定制WritableComparables与InputFormats处理复杂的数据类型
5、利用MapReduce编写、执行连接操作以整合不同数据集合
6、用于现实世界数据分析所需的高级HadoopAPI主题
7、用Java写MapReduce程序,用Streaming写MapReduce程序
8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码
9、Partitioners和Reducers如何一起工作,定制化Partitioners
10、定制Writable和WritableComparable
11、用SequenceFile和Avro数据文件存储二进制数据
【学员基础】
该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先
【授课形式】
案例教学+上机实践
【Cloudera 数据分析课程】
课时:4天
针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
来支持数据的转型和分析。
【课程内容】
1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
9、impala和hive、pig、关系数据库的不同、使用impala shell
10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
11、对比map reduce、pig、hive、impala和关系数据库
【学员基础】
该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
事先无需Java和Apache Hadoop的经验
【授课形式】
案例教学+上机实践
==============================================================
- Cloudera公司系统工程师
- Cloudera管理员认证讲师
- 清华大学硕士,在加入Cloudera之前为Intel中国大数据部门解决方案部技术负责人,带领过Intel大数据团队成功实施过国内最早的一批大数据平台建设项目,包括中国农业银行,太平洋保险和上海电信大数据平台,有着非常丰富的项目实战经验。在加入Intel之前,龚少成是eBay的高级软件工程师,负责eBay电子商务网站的计费和支付系统建设。
- 【授课风格】实践分享、善于启发引导、课程形式多样、风趣幽默、互动性强。
==================授课现场图=====================
北京大数据管理员CCAH培训



证书样本

===================================================================
上海开发人员CCDH(Developer For Spark And Hadoop)培训

证书样本

===================================================================
欢迎有兴趣参加cloudera大数据认证的小伙伴联系咨询!
【其他课程安排请咨询】手机:15601685012 QQ:358650622(助教)
QQ群:Cloudera大数据培训 308453209
- 培训费:7000元/人 考试费:2200元/人
- 包含培训费、资料、茶歇、结业证书等费用
======================我是分割线=========================
如有企业需要购买CDH企业版,或相关服务,也可以联系我!!!
=======================================================
大数据培训班 cloudera公司讲师面对面授课 CCDH CCAH CCP的更多相关文章
- 最新cloudera大数据培训班 ccah ccdh 数据分析师 数据科学家
上海2月21-24日Cloudera Developer training for Spark and Hadoop(CCA-175)北京2月23-26日Cloudera Developer tr ...
- 大数据核心知识点:Hbase、Spark、Hive、MapReduce概念理解,特点及机制
今天,上海尚学堂大数据培训班毕业的一位学生去参加易普软件公司面试,应聘的职位是大数据开发.面试官问了他10个问题,主要集中在Hbase.Spark.Hive和MapReduce上,基础概念.特点.应用 ...
- 基于Hadoop的大数据平台实施记——整体架构设计[转]
http://blog.csdn.net/jacktan/article/details/9200979 大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底 ...
- 基于Hadoop的大数据平台实施记——整体架构设计
大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底是否适用于您的组织,至少在互联网上已经被吹嘘成无所不能的超级战舰.好像一夜之间我们就从互联网时代跳跃进了大 ...
- BAT、网易、京东等如何做大数据风控的?
大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾.区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷. ...
- 知名大厂如何搭建大数据平台&架构
今天我们来看一下淘宝.美团和滴滴的大数据平台,一方面进一步学习大厂大数据平台的架构,另一方面也学习大厂的工程师如何画架构图.通过大厂的这些架构图,你就会发现,不但这些知名大厂的大数据平台设计方案大同小 ...
- Apache Kylin在4399大数据平台的应用
来自:AI前线(微信号:ai-front),作者:林兴财,编辑:Natalie作者介绍:林兴财,毕业于厦门大学计算机科学与技术专业.有多年的嵌入式开发.系统运维经验,现就职于四三九九网络股份有限公司, ...
- 大数据、AI“武装”企业服务:风控、检索、安全
大数据.AI“武装”企业服务:风控.检索.安全 小饭桌创业课堂2017-05-06 15:26:42阅读(127)评论(0) + - 文|吴杨可月 - - 小饭桌创业研究院出品 - 两件秘闻,将美国大 ...
- 【ZZ】大数据架构师基础:hadoop家族,Cloudera系列产品介绍
http://www.36dsj.com/archives/17192 大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为 ...
随机推荐
- 一个简单的例子理解Kubernetes的三种IP地址类型
很多Kubernetes的初学者对Kubernetes里面三种不同的IP地址和工作机制理解得不是很清楚. 本文我们通过一个最简单的例子来学习. 用如下命令行创建一个基于nginx的deployment ...
- 关于Java中截取字符串
获取系统时间:to_char(sysdate,'yyyy-mm-dd')截取CREATETIME常量的前10位字符串:CREATETIME.substring(0,10)截取DESCRIPT常量的前2 ...
- 命令式编程 vs 声明式编程
实际上我们绝大多数程序员都是在用命令式风格在编程, 这是和我们的冯诺依曼计算机机构密切相关的. (码农翻身注: 参见文章<冯诺依曼计算机的诞生>) 在一个冯诺依曼计算机中, 最核心的就是C ...
- HDU 1711 Number Sequence 【KMP应用 求成功匹配子串的最小下标】
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=1711 Number Sequence Time Limit: 10000/5000 MS (Java/O ...
- POJ 2528 Mayor's posters 【区间离散化+线段树区间更新&&查询变形】
任意门:http://poj.org/problem?id=2528 Mayor's posters Time Limit: 1000MS Memory Limit: 65536K Total S ...
- axios简单了解
简单介绍 axios是基于客户端的promise,面向浏览器和nodejs 特色 浏览器端发起XMLHttpRequests请求 node端发起http请求 支持Promise API 监听请求和返回 ...
- Autofac4.0以上的版本通过json配置文件方式实现IOC的MVC5设置
我们知道java用到了spring来实现IOC,而我们学习的.net也有.net spring.但是.net spring现在没人维护了,进公司后发现公司使用到了autofac.但是用的是3.X的版本 ...
- Windows 2008 server + IIS 7 设置身份模拟(ASP.NET impersonation)
IIS7 与 IIS 6 相比有了很大的改动,原来在 IIS 6 下可以的设置到了 IIS 7 下有的会发生变化.身份模拟的配置上,IIS7 和 IIS6有很大不同,网上IIS6的身份模拟的文章比较多 ...
- Mac iOS 允许从任何来源下载应用并打开
一个快捷的小知识点,mark! 允许从任何来源下载应用并打开,不用手动去允许,更加简洁! 只需一行命令 sudo spctl --master-disable 1.正常情况下,打开偏好设置,选择安全性 ...
- 魔板 Magic Squares(广搜,状态转化)
题目背景 在成功地发明了魔方之后,鲁比克先生发明了它的二维版本,称作魔板.这是一张有8个大小相同的格子的魔板: 1 2 3 4 8 7 6 5 题目描述 我们知道魔板的每一个方格都有一种颜色.这8种颜 ...