刚刚入门hadoop,如何去学习hadoop。google一篇学习路线图,与童鞋们共勉:

转自:http://blog.csdn.net/zhoudaxia/article/details/8801769

-----------------------------------------------------



按照这个路线图来学习即可。

    1、M. Tim Jones的三篇文章:

    用Hadoop进行分布式数据处理第1部分(入门):http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/index.html

    用Hadoop进行分布式数据处理第2部分(进阶):http://www.ibm.com/developerworks/cn/linux/l-hadoop-2/index.html

    用Hadoop进行分布式数据处理第3部分(应用程序开发):http://www.ibm.com/developerworks/cn/linux/l-hadoop-3/index.html



    2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍

    [google论文三]MapReduce简化大集群上的数据处理:http://duanple.blog.163.com/blog/static/709717672010923203501/

    词频统计的Map/Reduce程序可以从这里找到:http://blog.csdn.net/shijinupc/article/details/7522446

    Google论文系列:http://duanple.blog.163.com/blog/#m=0&t=3&c=google

    按照Hadoop各组件来串联:http://duanple.blog.163.com/blog/static/7097176720119791920962/

    

    3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章

    下面一些需要看:

    Hadoop Distributed File System简介:http://www.ibm.com/developerworks/cn/web/wa-introhdfs/index.html

    使用Apache Pig处理数据:http://www.ibm.com/developerworks/cn/bigdata/basic.html

        

    4、《开源软件架构》中的介绍

    (卷1第8章)HDFS--Hadoop分布式文件系统:http://www.ituring.com.cn/article/4299

    英文原文:http://www.aosabook.org/en/index.html (其中的卷1第8章)

    

    5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验

    http://www.alidata.org/archives

    

    6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验

[url]http://baidu-tech.com/[/url]

7、董的博客,关于Hadoop、分布式系统的研究

http://dongxicheng.org/recommend/

8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍

    优先看稳定版:http://hadoop.apache.org/docs/stable/

    最新版(包括下一代MapReduce即YARN的介绍):http://hadoop.apache.org/docs/current/

        

    9、caibinbupt的博客,Hadoop源代码分析系列

    http://caibinbupt.iteye.com/?page=6

    千与的专栏,Hadoop-0.20.0源码分析

    http://blog.csdn.net/shirdrn/article/category/595039/3

    

    10、spork的博客,其中关于Hadoop的系列

    http://www.cnblogs.com/spork/category/226077.html

    

    11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验

    http://www.cnblogs.com/chinacloud/archive/2010/12/03/1895369.html

    

    12、beanmoon的博客,其中的Hadoop系列

    http://www.cnblogs.com/beanmoon/

hadoop学习路线(转)的更多相关文章

  1. hadoop学习路线

    学习hadoop,首先我们要知道hadoop是什么? 说到底Hadoop只是一项分布式系统的工具,我们在学习的时候要理解分布式系统设计中的原则以及方法,只有这样才能以不变应万变.再一个就是一定要动手, ...

  2. Hadoop 学习路线

    大数据实时计算工程师/Hadoop工程师/数据分析师职业路线图 描述 本路线图是一个专门针对大数据实时处理.Hadoop工程师和数据分析师所设计的课程体系介绍,在实时计算方向主要包括了从数据收集框架. ...

  3. [hadoop]hadoop学习路线

    1.主要学习hadoop中的四大框架:hdfs.mapreduce.hive.hbase.这四大框架是hadoop最最核心的,学习难度最大的,也是应用最广泛的. 2.熟悉了解hadoop基本知识及其所 ...

  4. 大数据学习路线copy自淘宝

    一.hadoop视频学习(入门到精通) 二.数据挖掘(入门到精通) 三.Hadoop学习路线 1.开发前期准备 首先,如果你没有Java和Linux基础,建议你先简单学一下这两门课程,此宝贝里面都为你 ...

  5. Hadoop入门学习路线

    走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛. Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运 ...

  6. Hadoop生态系统学习路线

    主要介绍Hadoop家族产品,经常使用的项目包含Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa.新添加 ...

  7. 一位资深程序员大牛给予Java初学者的学习路线建议

    java学习这一部分其实也算是今天的重点,这一部分用来回答很多群里的朋友所问过的问题,那就是我你是如何学习Java的,能不能给点建议?今天我是打算来点干货,因此咱们就不说一些学习方法和技巧了,直接来谈 ...

  8. Hadoop学习路线图

    Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括, ...

  9. 一位资深程序员给予Java初学者的学习路线建议

    一位资深程序员给予Java初学者的学习路线建议 java学习这一部分其实也算是今天的重点,这一部分用来回答很多群里的朋友所问过的问题,那就是我你是如何学习Java的,能不能给点建议?今天我是打算来点干 ...

随机推荐

  1. 转载 -- iOS开发之JSON格式数据的生成与解析

    本文将从四个方面对IOS开发中JSON格式数据的生成与解析进行讲解: 一.JSON是什么? 二.我们为什么要用JSON格式的数据? 三.如何生成JSON格式的数据? 四.如何解析JSON格式的数据? ...

  2. HTML--2图片热点,网页划区,拼接,表单

    图片热点: 规划出图片上的一个区域,可以做出超链接,直接点击图片区域就可以完成跳转的效果. 示例: 网页划区: 在一个网页里,规划出一个区域用来展示另一个网页的内容. 示例: 网页的拼接: 在一个网络 ...

  3. windowsphone8.1学习笔记之应用数据(三)

    之前说了如何操作文本文件,如果是图片文件或者其他的二进制文件则需要操作文件的Stream或者Buffer数据.就需要用到DataReader和DataWriter这两个类了,这个的好好的练一下,以后的 ...

  4. The Log-Structured Merge-Tree (LSM-Tree

    https://www.cs.umb.edu/~poneil/lsmtree.pdf [Log-Structured Merge-Tree ][结构化日志归并树][要解决的问题]The   Log-S ...

  5. 一文快速搞懂MySQL InnoDB事务ACID实现原理(转)

    这一篇主要讲一下 InnoDB 中的事务到底是如何实现 ACID 的: 原子性(atomicity) 一致性(consistency) 隔离性(isolation) 持久性(durability) 隔 ...

  6. js实现随机选取[10,100)中的10个整数,存入一个数组,并排序。 另考虑(10,100]和[10,100]两种情况。

    1.js实现随机选取[10,100)中的10个整数,存入一个数组,并排序. <!DOCTYPE html> <html lang="en"> <hea ...

  7. selenium 页面超时后捕获异常也无法继续get(url)使用的问题解决方案

    参考这篇博客 http://www.xiaomilu.top/archives/106

  8. 关于android R.java文件无法创建的问题

    R.java文件无法创建的原因网上有很多说法普遍是以下两种: 1. xml文件有错误: 解决方法就是找到哪个xml有错然后把错误修复就OK了. 2.编码问题 这时候只要把xml文件的编码改成utf8就 ...

  9. [STM8L]基于STM8L152的TAB段式LCD液晶驱动的分析 - 单片机干货 - 中国电子技术论坛 - 最好最受欢迎电子论坛!

    [STM8L]基于STM8L152的TAB段式LCD液晶驱动的分析 - 单片机干货 - 中国电子技术论坛 - 最好最受欢迎电子论坛!.md 主控芯片为STM8L152C4T6自带LCD控制器,低功耗系 ...

  10. 服务器中判断客户端socket断开连接的方法【转】

    本文转载自:http://www.cnblogs.com/jacklikedogs/p/3976208.html 1, 如果服务端的Socket比客户端的Socket先关闭,会导致客户端出现TIME_ ...