Hadoop学习笔记内容说明_00

1、  观看云帆大数据梦琪老师的《企业级 Hadoop 1.x 应用开发基础课程》2014年4月左右版本。

2、  博客是在梦琪老师的随堂笔记上改动的,方便的是自己以后回顾学习,也或许能给需要改方面帮助的同行提供些许帮助,在此非常感谢梦琪老师。

3、  本系列是在CentOS6.4+hadoop1.2.1上实验通过的。

4、  由于本人刚刚接触,对Linux也只是初步了解,实验过程中遇到比较奇葩的问题,也在此博客写出。

5、  云帆大数据官网公布了一些公开的视频资源,大家可以前往学习。

第一个专题

Linux 系统环境搭建和基本命令使用:上课使用虚拟机,CentOS  6.4  64 位操作系统,基本命令要 熟悉,一次课时。

二至五个专题Hadoop 1.x  系列的核心,基础)

Hadoop 本地(单机)模式和伪分布式模式安装:Hadoop  1.x  理论知识,架构体系,安装模式, 认识 HDFS  文件系统,运行 MapReduce 程序 WordCount,如何查看 Hadoop  源码,Hadoop  1.x  包的 结构等等,三次课时

HDFS 的体系结构、Shell 操作、Java  API 使用和应用案例:深入讲解 HDFS  相关内容,包括 HDFS 架构与设计,优缺点,如何存储文件;如何访问 HDFS  文件系统,HDFS Shell  命令行、JAVA API 方式 方式;讲解一些企业中的小案例,比如小文件存储处理、类似百度网盘的分析(使用 HDFS)等等, 三到四次课时

MapReduce 入门、框架原理、深入学习和相关 MR 面试题:深入讲解 MapReduce,架构体系,执 行流程,MapReduce 执行细节,讲解 MapReduce 编写(WordCount):数据类型、输入输出格式、 Combine、Partitioner、Sort 和 Group,插入企业中 MapReduce  简单使用案例,七到八次课时

Hadoop 集群安装管理、NameNode 安全模式和 Hadoop  1.x 串讲复习:属于 Hadoop  运维工程师 的课程,集群的安装部署(建立在伪分布式安装基础上)、NN SafeMode、Hadoop  管理员命令的使用。 添加节点(机器)、卸载节点(机器),监控 Hadoop  集群,三次课时

第六至十个专题Hadoop 1.x 生态系统,HBase Hive

HBase 入门、存储原理、Shell  命令、Java  API 操作和应用案例:分布式数据库(NoSql 数据库),

类似于 Oracle 数据库,存储几十亿行数据,上万列数据。准实时查询,与 MR 很好的集成,进行计算 处理数据。体系架构、访问(Shell  和 API)、MapReduce、管理,深入的讲解,四次课时左右。

Zookeeper 集群安装、回顾 HBase 和 MySql  5.1 安装与基本使用:主要为 HBase 和 Hive 基础理论 讲解。Zookeeper 协调 HBase,MySql 作为 Hive 元数据管理。两次课时。

Hive 安装、配置元数据、HiveQL 语句学习和应用案例

串讲复习 HDFS、MapReduce、HBase、Hive 和 Sqoop 安装与数据导入导出:整体复习,串讲 Hadoop、 HBase 和 Hive,在企业中如何使用,如何考虑,结合三者进行考虑。Sqoop 用于数据的导入导出,将 关系型数据库中的数据与 HBase 和 Hive 之间的相互导入导出。三次课时。

答疑总结、任务调度 Azkaban 安装和使用:进行整个 Hadoop 1.x 课程的答疑,与项目的讲解, 讲 解任务调度框架,如何管理 Job、管理 Hive。

第十一个专题

Hadoop 2.2.0 介绍、集群安装和商业版 Hadoop 介绍:Hadoop 2.X 介绍,Hadoop 2.4.0  为基础讲解, 理论讲解:与 Hadoop  1.x  不同;优点在哪里。安装:分布式安装,HDFS 和 MapReduce  程序测试。 介绍商业版的 Hadoop:对 Apache  开源 Hadoop 版本的包括,CDH  Hortonworrsk,Interl,华为,IBM; 两次课时。

第十二个专题

Cloudera  Hadoop 介绍、CM4.8 安装和部署 CDH4.5:商业版 hadoop  CDH 的介绍,以及管理工具

CM 的安装,两次课时。

01_Hadoop学习笔记内容说明的更多相关文章

  1. Angular6 学习笔记——内容投影, ViewChild和ContentChild

    angular6.x系列的学习笔记记录,仍在不断完善中,学习地址: https://www.angular.cn/guide/template-syntax http://www.ngfans.net ...

  2. .NET GC机制学习笔记

    学习笔记内容来自网络资料摘录http://www.cnblogs.com/springyangwc/archive/2011/06/13/2080149.html 1.GC介绍 Garbage Col ...

  3. jeecms学习笔记

    jeecms学习笔记 内容管理系统 1.栏目列表标签 作用:获取栏目的列表 [@cms_channel_list] [#list tag_list as b] <a href="${b ...

  4. C++内存管理学习笔记(3)

    /****************************************************************/ /*            学习是合作和分享式的! /* Auth ...

  5. python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容

    python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖 ...

  6. Android学习笔记(二十)——自定义内容提供器

    //此系列博文是<第一行Android代码>的学习笔记,如有错漏,欢迎指正! 如果我们想要实现跨程序共享数据的功能,官方推荐的方式就是使用内容提供器,可以通过新建一个类去继承 Conten ...

  7. Android学习笔记(十九)——内容提供器

    //此系列博文是<第一行Android代码>的学习笔记,如有错漏,欢迎指正! 内容提供器(Content Provider)主要用于在不同的应用程序之间实现数据共享的功能,它提供了一套完整 ...

  8. python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息,抓取政府网新闻内容

    python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息PySpider:一个国人编写的强大的网络爬虫系统并带有强大的WebUI,采用Python语言编写 ...

  9. VSTO学习笔记(九)浅谈Excel内容比较

    原文:VSTO学习笔记(九)浅谈Excel内容比较 说起文件内容比较,或许我们首先想到的是UltraCompare这类专业比较的软件,其功能非常强大,能够对基于文本的文件内容作出快速.准确的比较,有详 ...

随机推荐

  1. Modification of UCT with Patterns in Monte-Carlo Go(论文阅读)

    摘要:用于解决多臂赌博机UCB1算法已经被扩展成了解决极大极小树搜索的UCT算法.我们开发了一套Monte-Carlo围棋程序,MoGo,这是第一个使用UCT算法实现的计算机围棋程序.我们解释了为了围 ...

  2. MySQL同步状态双Yes的假象及 seconds_behind_master的含义

    MySQL同步状态双Yes的假象及seconds_behind_master的含义   近期由于特殊原因有一台主库宕机了一个小时没有处理,说起来这是个挺不好啥意思的事情,但是由于这个事情反而发现个比较 ...

  3. Win10中配置jdk之后javac无法运行

    环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数,如:临时文件夹位置和系统文件夹位置等. 环境变量是在操作系统中一个具有特定名字的对象,它包 ...

  4. Gmail 邮件配置备忘

    1.smtp端口号不是默认的25,smtp的是587 2.必须设置“允许使用不够安全的应用” 其他的按照网上文档设置就好了

  5. C++11写算法之冒泡排序

    冒泡排序很形象,指从数组后面将更小的值慢慢浮到前面去,每遍历一趟使得最小值浮到最前面(指当前位置). 这里有点小技巧,当某一次遍历过程中发现无交换,则说明此时数组已经排序完成,可提前退出. 时间复杂度 ...

  6. Quartz.NET 作业调度

    Quartz 简介: Quartz.NET是一个开源的作业调度框架,非常适合在平时的工作中,定时轮询数据库同步,定时邮件通知,定时处理数据等. Quartz.NET允许开发人员根据时间间隔(或天)来调 ...

  7. eclipse 4.3 汉化

    打开浏览器,浏览“参考资料”内给出的“eclipse语言包下载”地址,在博客新页面找到地址链接,如图所示.“Babel Language...”开头的一栏下面就是各个eclise版本的语言包,此处以I ...

  8. Partial Sum

    Partial Sum Accepted : 80   Submit : 353 Time Limit : 3000 MS   Memory Limit : 65536 KB  Partial Sum ...

  9. 距离,margin padding ,width height 用法 ,记录

    margin:0 auto 表示什么意思 margin后面如果只有两个参数的话,第一个表示top和bottom,第二个表示left和right 因为0 auto,表示上下边界为0,左右则根据宽度自适应 ...

  10. /proc/kcore

    [root@b proc]# ls -lh /proc/kcore-r-------- 1 root root 128T Sep 29 09:39 /proc/kcore[root@b proc]# ...