安装hadoop是一件非常容易的事情,读者可以在官网上下载到最近的几个hadoop版本。网址为http://apache.etoak.com//hadoop/core/.
   目前,hadoop可以运行在linux,unix,windows系统上。实际上hadoop是为在linux平台上使用而开发出来的。但是hadoop在一些主流的unix版本(甚至包括Mac OS X)也运行良好。对于windows,这个问题有些复杂。如果想在windows上运行hadoop,那么必须先安装Cygwin以模拟linux环境,然后再安装hadoop。在unix上安装hadoop和在linux上安装hadoop的过程基本相同,因此对在unix上安装hadoop的过程不再赘述。

安装与配置

在linux安装Hadoop之前,需要先安装两个程序:
      Sun公司的java-1.6
      SSH,推荐安装OpenSSH

安装JDK

安装JDK是一个很简单的过程,以ubuntu为例。
   (1)下载安装JDK
   确保可以连接到互联网,输入命令:
   sudo apt-get install sun-java6-jdk
   输入密码,确认,就可以安装java了
   (2)配置环境变量:
   输入命令:
   sudo gedit /etc/profile
   输入密码,打开profile文件
   在最下面输入如下内容:
   #set Java Environment
   export JAVA_HOME= (你的java安装位置,一般为/usr/lib/jvm/java-6-sun)
   export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
   export PATH="$JAVA_HOME/:$PATH"
   (3)验证java是否安装成功
   输入命令:
   java -version
   查看信息
   java version "1.6.0_14"
   Java(TM) SE Runtime Environment (build 1.6.0_14-b08)
   Java HotSpot(TM) Server VM (build 14.0-b16, mixed mode)

配置ssh免密码登录

同样的,以ubuntu为例,用户名为u:
   (1)确认已经连接上互联网,输入命令:sudo apt-get install ssh
   (2)配置可以无密码登陆本机:
   首先查看在u用户下是否存在.ssh文件夹(注意ssh前面有“.”,这是一个隐藏文件夹),输入命令:
   ls -a /home/u。
   接下来,输入命令:
   ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
   这个命令会在.ssh文件夹下创建两个文件id_dsa及id_dsa.pub,这是ssh的一对私钥和公钥,类似于钥匙及锁,把id_da.pub(公钥)追加到授权的key里面去,
   输入命令:
   cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
这段话的意思是把公钥加入到用于认证的公钥文件中,这里authorized_keys是用于认证的公钥文件。
   至此无密码登陆本机以安装完成。
   (3)验证ssh已安装成功及无密码登陆本机
   输入命令:
   ssh -version
   显示结果:
   OpenSSH_5.1p1 Debian-6ubuntu2, OpenSSL 0.9.8g 19 Oct 2007
   Bad escape character 'rsion'.
   这显示了ssh已经安装成功
   输入命令:
   ssh localhost
   会有如下显示:
   The authenticity of host 'localhost (::1)' can't be established.
   RSA key fingerprint is 8b:c3:51:a5:2a:31:b7:74:06:9d:62:04:4f:84:f8:77.
   Are you sure you want to continue connecting (yes/no)? yes
   Warning: Permanently added 'localhost' (RSA) to the list of known hosts.
   Linux master 2.6.31-14-generic #48-Ubuntu SMP Fri Oct 16 14:04:26 UTC 2009 i686

To access official Ubuntu documentation, please visit:
   http://help.ubuntu.com/

Last login: Mon Oct 18 17:12:40 2010 from master
   admin@hadoop:~$
   如上显示,说明已经安装成功,第一次登录时会询问你是否继续链接,输入yes即可以进入。
   实际上,在hadoop的安装过程中,是否无密码登陆不是必须的,但是如果不配置无密码登陆的话,每次启动hadoop,都需要输入密码以登陆到每台daotanode,考虑到一般的hadoop集群动辄数十数百台机器,因此一般来说都会配置ssh的无密码登陆。

安装运行Hadoop

介绍hadoop的安装之前,介绍一下hadoop对各个节点的角色定义。
   Hadoop按三类分别将主机划分为两种角色,首先,最基本的就是master和slave,主人与奴隶;第二,按hdfs的角度,将主机划分为namenode和datanode(在分布式文件系统中,目录的管理很重要,管理目录的就相当于主人,而namenode就是目录管理者);第三,按mapreduce的角度,将主机划分为jobtracker和tasktracker(一个job经常被划分为多个task,从这个角度不难理解他们之间的关系)。
hadoop有官方发行版与cloudera版,其中cloudera版式hadoop的商用版本,这里笔者先介绍hadoop官方发行版的安装方法。
   (1)hadoop官方发行版
   Hadoop有三种运行方式,单节点方式,单机伪分布方式与集群方式。乍看之下,前两种方式并不能体现云计算的优势,在实际应用并没有什么意义,但是在程序的测试与调试中,还是很有意义的。
   你可以在以下地址获得hadoop的官方发行版
   http://www.apache.org/dyn/closer.cgi/hadoop/core/
   下载hadoop-0.20.2.tar.gz并将其解压,这里将其解压到用户目录下,一般为/home/[你的用户名]/。
   单节点配置方式:
   安装单节点的hadoop无需配置,在这种方式下,hadoop被认作为一个单独的java进程,这种方式经常用来调试。
   伪分布式hadoop配置:
   你可以把伪分布式的hadoop看作为一个只有一个节点的集群,在这个集群中,这歌节点既是master,也是slave;既是namenode也是datanode;既是jobtracker,也是tasktracker。
   配置伪分布的过程也很简单,只需要修改几个文件
   进入conf文件夹,修改配置文件:
   Hadoop-env.sh:
   export JAVA_HOME=“你的java安装地址”
   指定java位置:
   conf/core-site.xml:
<configuration>
     <property>
 <name>fs.default.name</name>
 <value>hdfs://localhost:9000</value>
     </property>
</configuration>
   这是hadoop核心的配置文件,这里配置的是hdfs(hadoop的分布式文件系统)的地址及端口号
   conf/hdfs-site.xml:
<configuration>
     <property>
 <name>dfs.replication</name>
 <value>1</value>
     </property>
</configuration>
   这是hadoop中hdfs的配置,配置的备份方式,默认为3,在单机版hadoop中,需要将其改为1
   conf/mapred-site.xml:
<configuration>
     <property>
 <name>mapred.job.tracker</name>
 <value>localhost:9001</value>
     </property>
</configuration>
   这是hadoop中mapreduce的配置文件,配置的是jobtracker的地址及端口
   需要注意的是,如果安装的是0.20之前的版本,那么只有一个配置文件,即为hadoop-site.xml。
   接下来,启动hadoop前,需格式化hadoop的文件系统hdfs(这点与windows是一样的,重新分区后的卷总是需要格式化的),进入hadoop文件夹
   输入命令:
   bin/hadoop namenode ?format
   格式化文件系统,接下来,启动hadoop
   输入命令:
   bin/start-all.sh(全部启动)
   最后,验证hadoop是否安装成功
   打开浏览器,分别输入网址
   http://localhost:50030 (mapreduce的web页面)
   http://localhost:50070 (hdfs的web页面)
   如果都能查看,说明hadoop已经安装成功。
   对于hadoop来说,mapreduce及hdfs都是必须的,但是如果有必要的话,你依然可以只启动hdfs(start-dfs.sh)或mapreduce(start-mapred.sh)。

Hadoop的安装与配置说明的更多相关文章

  1. 【从零开始学习Hadoop】--1.Hadoop的安装

    第1章 Hadoop的安装1. 操作系统2. Hadoop的版本3. 下载Hadoop4. 安装Java JDK5. 安装hadoop6. 安装rsync和ssh7. 启动hadoop8. 测试had ...

  2. Hadoop Linux安装

    Hadoop Linux安装 步骤流程 1.硬件准备 2.软件准备(推荐CDH) 3.将Hadoop安装包分发到各个节点下 4.安装JDK 5.修改/etc/hosts配置文件 6.设置SSH免密码登 ...

  3. hadoop环境安装及简单Map-Reduce示例

    说明:这篇博客来自我的csdn博客,http://blog.csdn.net/lxxgreat/article/details/7753511 一.参考书:<hadoop权威指南--第二版(中文 ...

  4. hadoop群集安装中碰到的问题

    在hadoop群集安装结束后,进行格式测试出现问题如下 格式化 cd /data/hadoop/bin ./hdfs namenode -format 15/01/21 05:21:17 WARN f ...

  5. 从零开始学习Hadoop--第1章 Hadoop的安装

    Hadoop的安装比较繁琐,有如下几个原因:其一,Hadoop有非常多的版本:其二,官方文档不尽详细,有时候更新脱节,Hadoop发展的太快了:其三,网上流传的各种文档,或者是根据某些需求定制,或者加 ...

  6. Hadoop学习---安装部署

    hadoop框架 Hadoop使用主/从(Master/Slave)架构,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracke ...

  7. hadoop分布式安装教程(转)

    from:http://www.cnblogs.com/xia520pi/archive/2012/05/16/2503949.html 1.集群部署介绍 1.1 Hadoop简介 Hadoop是Ap ...

  8. hadoop生态圈安装详解(hadoop+zookeeper+hbase+pig+hive)

    -------------------------------------------------------------------* 目录 * I   hadoop分布式安装   * II zoo ...

  9. Hadoop单机版安装,配置,运行

    Hadoop是最近非常流行的东东啦,但是乍一看都觉得是集群的东东,其实在单机版上安装Hadoop也是可以的,并且安装好以后可以很方便的进行程序的调试,调试好程序以后再丢到集群中,放心的算吧,呵呵.. ...

随机推荐

  1. 自动化中的PageObject思想

    谈着这个话题很大,因为我自己在自动化分层的方面做的就不是很好,最近在做java+selenium中,如果不分层去管理,代码就显得很乱,如下: 下面代码主要是做了一个登录,登录后在修改自己的一些个人信息 ...

  2. mac 如何进入/usr/sbin目录

    1.进入terminal, 输入 ls /usr/sbin 2.在finder>前往文件夹,输入路径/usr/sbin

  3. JMS - 消息选择器

    消息选择器 将消息选择器应用在消费者,消费者就只会接受能通过过滤器的消息.消息选择器是基于 SQL-92 条件表达式语法的一个子集.消息选择器由三个元素组成:标识符.常量和标记运算符. 标识符 标识符 ...

  4. ASP.NET MVC Partial页输出JS

    很多情况Partial是需要引用到JS的,通常做法是吧JS在引用Partial的页面中加入JS文件或者JS代码. 前阵子网上看到一段代码可以在Partial页面中添加JS,输出道引用页面. publi ...

  5. 每天一道LeetCode--172. Factorial Trailing Zeroes

    Given an integer n, return the number of trailing zeroes in n!. Note: Your solution should be in log ...

  6. ActionBar 的简单使用

    About ActionBar The action bar is one of the most important design elements you can implement for yo ...

  7. Android之简单页面跳转

    Uri.parse方法返回的是一个URL类型,通过URL可以访问一个网络上的或者本地资源,Intent()方法是调用哪个组件来打开这个URL. package com.example.web; imp ...

  8. iOS常用的设计模式

    iOS常用的设计模式有:单例模式.委托模式.观察者模式和MVC模式.下面分别简单介绍. 一:单例模式 我们常用的UIApplication.NSUserdefaults.NSNotificationC ...

  9. YII Framework 1.0运行时序图分析过程

  10. NFC规范学习之一 ---整体结构

    1.NFC 采用两个感应线圈进行数据交互,其中至少必须有一个设备产生13.56MHZ的磁场,该场被调制以方便数据传输.通讯中,一个设备处于initiator模式(就是发起通讯)另外一个设备则工作在ta ...