注:以下链接均为近期hadoop集群搭建及mapreduce应用开发查找到的资料。使用hadoop2.6.0,其中hadoop集群配置过程下面的文章都有部分参考。

hadoop集群配置方法:

---------------------------------------------------------------------------------------------------------------------------------------------------------

Hadoop 三台主机 集群搭建 详解   (集群搭建过程的主要参考文章,但是其介绍的hadoop版本较低,其中core-site.xml需要修改, 没有yarn-site.xml的配置过程)

http://www.cnblogs.com/shitouer/archive/2012/05/21/2511060.html

利用Cloudera实现Hadoop  (hadoop版本较低,但是排版很好,可读性较好)

http://wiki.ubuntu.org.cn/%E5%88%A9%E7%94%A8Cloudera%E5%AE%9E%E7%8E%B0Hadoop

CentOS6.4配置Hadoop-2.6.0集群配置安装指南 (hadoop2.6.0版本,有xml配置文件示例)

http://blog.csdn.net/tianya846/article/details/42176507

Hadoop中的集群配置和使用技巧  (文章里介绍的mapreduce思想值得一看)

http://www.infoq.com/cn/articles/hadoop-config-tip

hadoop2.6安装配置以及整合eclipse开发环境   (主要是eclipse的设置过程)

http://blog.csdn.net/crazyzhb2012/article/details/43083785

mapreduce应用:wordcount详解+xml解析:

---------------------------------------------------------------------------------------------------------------------------------------------------------

:WordCount运行详解(2)

http://developer.51cto.com/art/201206/345334_1.htm

How does XML be parsed in hadoop in parallel

http://stackoverflow.com/questions/25485126/how-does-xml-be-parsed-in-hadoop-in-parallel

xml解析类的代码:

https://svn.apache.org/repos/asf/mahout/branches/mahout-0.2/examples/src/main/java/org/apache/mahout/classifier/bayes/XmlInputFormat.java

yarn配置项解析:

---------------------------------------------------------------------------------------------------------------------------------------------------------

Hadoop MapReduce Next Generation - Cluster Setup  (官网的yarn框架集群配置参数介绍)

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

Hadoop 新 MapReduce 框架 Yarn 详解   (hadoop新旧框架对比)

http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/

Hadoop YARN配置参数剖析(1)—RM与NM相关参数   (详细的yarn配置参数解释)

http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-resourcemanager-nodemanager/

hadoop集群配置方法---mapreduce应用:xml解析+wordcount详解---yarn配置项解析的更多相关文章

  1. Hadoop集群(第6期)_WordCount运行详解

    1.MapReduce理论简介 1.1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然 ...

  2. 高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南

    原文:http://my.oschina.net/wstone/blog/365010#OSC_h3_13 (WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南 [X] ...

  3. 大数据测试之hadoop集群配置和测试

    大数据测试之hadoop集群配置和测试   一.准备(所有节点都需要做):系统:Ubuntu12.04java版本:JDK1.7SSH(ubuntu自带)三台在同一ip段的机器,设置为静态IP机器分配 ...

  4. hadoop集群配置和在windows系统上运用java操作hdfs

    安装 配置 概念 hadoop常用shell命令 使用java操作hadoop 本文介绍hadoop集群配置和在windows系统上运用java操作hdfs 安装 http://mirror.bit. ...

  5. Hadoop集群配置(最全面总结)

    Hadoop集群配置(最全面总结) 通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker.这些机器是masters.余下的机器即作为DataNode也作为Ta ...

  6. Hadoop集群配置(最全面总结 )(转)

    Hadoop集群配置(最全面总结) huangguisu 通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker.这些机器是masters.余下的机器即作为Da ...

  7. Hadoop 集群配置记录小结

    Hadoop集群配置往往按照网上教程就可以"配置成功",但是你自己在操作的时候会有很多奇奇怪怪的问题出现, 我在这里整理了一下常见的问题与处理方法: 1.配置/etc/hosts ...

  8. apache-storm-1.0.2.tar.gz的集群搭建(3节点)(图文详解)(非HA和HA)

    不多说,直接上干货! Storm的版本选取 我这里,是选用apache-storm-1.0.2.tar.gz apache-storm-0.9.6.tar.gz的集群搭建(3节点)(图文详解) 为什么 ...

  9. Hadoop集群配置免密SSH登录方法

    Hadoop集群包含1个主节点和3个从节点,需要实现各节点之间的免密码登录,下面介绍具体的实现方法. 一.Hadoop集群环境 二.免密登录原理 每台主机authorized_keys文件里面包含的主 ...

随机推荐

  1. leetcode728

    vector<int> selfDividingNumbers(int left, int right) { vector<int> V; for (int i = left; ...

  2. 【283】ArcMap 中河流字体设置

    左斜字体的设置 1.  右键属性设置如下,将字体角度如下设置,并点击改变样式的按钮 2. 首先设置颜色如下,然后设置加粗斜体,最后勾选 CJK character orientation 的复选框 C ...

  3. 168. Excel Sheet Column Title 由数字返回excel的标题

    [抄题]: Given a positive integer, return its corresponding column title as appear in an Excel sheet. F ...

  4. while 循环和do while循环

    while循环是先检测条件符合不符合,符合才执行循环体内容,不符合就跳过while循环. 就和一个房间有两个门,一个前门,一个后门,while循环是当你进入前门的时候有人会检查你的身份,只有身份符合条 ...

  5. BT下载的原理 和疑问

    我心中有几个疑问,同时也搜索了点素材,肯能对理解问题有帮助. BT下载,即P2P下载,是一种不需要中心化服务器的下载,实现原理是,每个客户端在下载的时候也作为服务器. 我的疑问是,P2P各个节点是如何 ...

  6. selenium+phantomjs解析JS

    背景知识: PhantomJS 是一个基于WebKit的服务器端 JavaScript API.它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, J ...

  7. oracle获取表和列的备注

    using System;using System.Collections.Generic;using System.Data;using System.Linq;using System.Runti ...

  8. Java之集合框架vector类设计原理

  9. JavaEE互联网轻量级框架整合开发(书籍)阅读笔记(3):常用动态代理之JDK动态代理、CGLIB动态代理

    一.动态代理的理解 动态代理的意义在于生成一个占位(又称代理对象),来代理真实对象,从而控制真实对象的访问.        先来谈谈什么是代理模式.        假设这样一个场景:你的公司是一家软件 ...

  10. cmake的一些词的解释

    cmake中一些预定义变量 PROJECT_SOURCE_DIR  工程的根目录 PROJECT_BINARY_DIR    运行cmake命令的目录,通常是${PROJECT_SOURCE_DIR} ...