Hadoop学习笔记1－如何简单布署hadoop

企业机型配置：

选型标准：普通的，廉价的，标准的（容易替换的），工业化大规模生产的

CPU：支持多核CPU，如2个4核CPU

内存：16G以上，内存越大，常用数据都缓存在内存，提高速度

硬盘：不需RAID，也不需使用SCSI、SAS、SSD硬盘，只需普通SATA硬盘即可，只要容量足够。

网络：建议千兆网和高带宽交换机，hadoop对各节点服务器的数据通讯量极为重要。Infinband可以不用考虑。

网络拓扑设计：

使用局域网布署，尽量不使用低速率的跨数据中心连接。

hadoop支持机架感知机制。

操作系统选择：

主流操作系统：Linux，只要是最新版即可，例：CentOs, Unbuntu, Redhat等。

window下需要cygwin，但可能出现意料不到的问题。

不区分32/64位数，基于Java环境。

实验布署环境：

伪分布模式：在单机环境下同时启动namenode,datanode,jobtracker,tasktracker, secondary namenode等五个进程，即多个节点都模拟运行在一台机下。

完全分布模式：正常的hadoop集群，由多个各司其职的节点构成。

以CentOs虚拟机为例：

可使用默认分区，CLI界面即可。

需要安装ssh，vi，java最新版。

注意需要将iptables, selinux等防火墙关闭。

配置工作：

配置hosts文件：

在各节点的系统内设置好各节点的IP和对应的主机名，文件位置：/etc/hosts。

以此步骤以便各节点能根据主机名称找到该机器以便通讯，防止局域网IP可能某些原因而变化导致找不到相应机器而通讯失败。

此步骤应最先设置好。
建立hadoop运行的帐号。

配置免密码ssh：

需要生成密钥复制到各节点中，使各节点之间达到ssh的免密码连接。

注意：

密钥文件的权限数为644，即rw-r—r—
各节点的密钥也要复制一份给自身，达到ssh免密码连接访问自身。

CentOs 6默认安装了ssh，只需确认sshd服务是否自启动即可。ssh需要手动安装：yum install openssh-clients。

免密码方法设置：http://www.cnblogs.com/xiwang6428/p/3451711.html

下载解压或安装hadoop安装包。

一般是下载tar.gz压缩包，可解压在用户的家目录下。
配置hadoop相关文件：（以1.2版为例，位于hadoop目录/conf/）

文件名	格式	描述	修改配置
hadoop-env.sh	bash脚本	运行hadoop所需的环境变量	设置export JAVA_HOME=java的安装目录
core-site.xml	xml配置文件	配置hadoop核心设置，如HDFS和MadReduce的I/O设置	在<configuration>节点间加入： <property> <name>fs.default.name</name> #指定namenode名称节点 <value>hdfs://namenode主机名:9000</value> </property> <property> <name>hadoop.tmp.dir</name> #指定hadoop的临时目录，如果不设定会默认以/tmp为临时目录。该目录会自动清空，所以不要用。 <value>/home/hadoop运行的用户帐号/hadoop/tmp</value> </property>
hdfs-site.xml	xml配置文件	配置HDFS守护进程：namenode,secondary namenode和datanode。	在configuration节点添加： <property> <name>dfs.replication</name> #指定数据复制份数，一般来说有几个数据节点就复制几份 <value>2</value> </property>
mapred-site.xml	xml配置文件	配置mapreduce进程：jobtracker和tasktracker	在configuration节点添加： <property> <name>mapred.job.tracker</name> #设定jabtracker的监听地址和端口 <value>namenode主机名:9001</value> </property>
masters	文本文件	运行主要的次要的namenode的主机名列表（每行一个）	每行添加一个主机名
slaves	文本文件	运行datanode和tasktracker的主机名列表（每行一个）	每行添加一个主机名

将配置好的hadoop目录分发复制到各节点的主机内。

因为各机的配置都相同，所以直接复制过去即可。

例：scp –r ./hadoop 目标主机名:/home/用户名

格式化分布式文件系统：

在namenode主机的hadoop目录下，执行 bin/hadoop namenode –format

出现一堆信息，如成功有提示：has been successfully formatted.

启动守护进程:

在namenode主机的hadoop目录下，执行 bin/start-all.sh

相关的启动信息会记录在各节点主机的 hadoop目录/logs下。

检测守护进程启动情况

/usr/java/jdk1.6.0_26/jps #假设此为java安装目录

Hadoop学习笔记1－如何简单布署hadoop的更多相关文章

hadoop学习笔记之一步一步部署hadoop分布式集群
一.准备工作同一个局域网中的三台linux虚拟机,我用的是redhat6.4,如果主机是windows操作系统,可以先安装vmware workstation, 然后在workstation中装上3 ...
Hadoop学习笔记系列
Hadoop学习笔记系列一.为何要学习Hadoop? 这是一个信息爆炸的时代.经过数十年的积累,很多企业都聚集了大量的数据.这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼 ...
Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...
Hadoop学习笔记(9) ——源码初窥
Hadoop学习笔记(9) ——源码初窥之前我们把Hadoop算是入了门,下载的源码,写了HelloWorld,简要分析了其编程要点,然后也编了个较复杂的示例.接下来其实就有两条路可走了,一条是继续 ...
Hadoop学习笔记(6) ——重新认识Hadoop
Hadoop学习笔记(6) ——重新认识Hadoop 之前,我们把hadoop从下载包部署到编写了helloworld,看到了结果.现是得开始稍微更深入地了解hadoop了. Hadoop包含了两大功 ...
Hadoop学习笔记(2)
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(5) ——编写HelloWorld(2)
Hadoop学习笔记(5) ——编写HelloWorld(2) 前面我们写了一个Hadoop程序,并让它跑起来了.但想想不对啊,Hadoop不是有两块功能么,DFS和MapReduce.没错,上一节我 ...
Hadoop学习笔记(2) ——解读Hello World
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(1) ——菜鸟入门
Hadoop学习笔记(1) ——菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序. ...

随机推荐

git忽略以点开头的文件夹
git忽略以点开头的文件夹好像不是什么问题,可是我用的时候不好使,还是记录下参考:http://www.oschina.net/question/1437985_2181276
快速入门系列--CLR--01基本概念
在.NET平台用C#这么久,自然会发现其版本很多,相应的概念也会很多,常常都是萌萌哒.而在实际工作中经常会遇到需要配置dll版本号,公钥token等场景,因而对C#.NET.CLR.框架类型等基础概念 ...
Entity Framework 5中应用表值函数进行Linq查询
Entity Framework 5引入了表值函数(Table-Valued Functions TVFs).表值函数的返回类型是一个Table类型,可用在SQL查询语句中.最简单的表值函数,读取客户 ...
通过Class获取标签，兼容的几种思路
在js中通过document.getElementsByClassName()在低版本IE浏览器中不兼容.然后我写了几种方案,大家可以参考参考. html代码 <!DOCTYPE html> ...
一次意外的X锁不阻塞问题
最近有一个朋友问我一个关于给查询操作强制上X锁却不阻塞的问题.该查询写在一个存储过程中,代码如代码1所示: 1: create PROC [dbo].[GetCityOrders] 2: @c ...
NYOJ995硬币找零(简单dp)
/* 题意:给你不同面额的硬币(每种硬币无限多),需要找零的面值是T,用这些硬币进行找零, 如果T恰好能被找零,输出最少需要的硬币的数目!否则请输出剩下钱数最少的找零方案中的最少硬币数! 思路:转换成 ...
[转载]基于TFS实践敏捷-Scrum模式运用
根据Forrester Research今年第二季度的一份研究报告,在超过1000名专业开发人员中,采用敏捷模式进行软件开发的已经有10.9%采用了Scrum模式,在所有的敏捷开发模式中名列首位,而在 ...
Android图片加载库的理解
前言这是“基础自测”系列的第三篇文章,以Android开发需要熟悉的20个技术点为切入点,本篇重点讲讲Android中的ImageLoader这个库的一些理解,在Android上最让人头疼是 ...
列表视图(ListView和ListActivity)
在ListView中显示网络图片 ImageView 类虽然有一个 setImageUri 方法,但不能直接接受一个由网络地址生成的uri作为参数从而显示图片,我们只好使用其 setImageBitm ...
java反射实现动态代理
参考:http://www.cnblogs.com/rollenholt/archive/2011/09/02/2163758.html http://my.oschina.net/lyp3314/b ...

Hadoop学习笔记1－如何简单布署hadoop

Hadoop学习笔记1－如何简单布署hadoop的更多相关文章

随机推荐

热门专题