Hadoop环境搭建2_hadoop安装和运行环境

1 运行模式：

单机模式（standalone）：单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时，Hadoop无法了解硬件安装环境，便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时，Hadoop会完全运行在本地。因为不需要与其他节点交互，单机模式就不使用HDFS，也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式（Pseudo-Distributed Mode）：伪分布模式在“单节点集群”上运行Hadoop，其中所有的守护进程都运行在同一台机器上。该模式在单机模式之上增加了代码调试功能，允许你检查内存使用情况，HDFS输入输出，以及其他的守护进程交互。

全分布模式（Fully Distributed Mode）： Hadoop守护进程运行在一个集群上。

2 下载Hadoop：------------------笑一个------------------------　

获取安装包后
在home/user目录下创建一个文件夹hadoop, 便于管理hadoop;
更改该文件夹的所有者：sudo chown -R user:usergroup hadoop
有了这步后，更改文件夹，就可以在Ubuntu界面下来操作来

3 配置的过程：

　　1修改配置文件：

　　　　five@ubuntu:~/hadoop/conf$ gedit hadoop-env.sh　　　

　　　　添加如下：

export JAVA_HOME=/usr/lib/jvm/java-6-openjdk-amd64 (视你机器的java安装路径而定)
export HADOOP_HOME=/home/five/hadoop
export PATH=$PATH:/home/five/hadoop/bin

生效：source hadoop-env.sh

提示：当然你可以在用户环境变量中添加第二个第三个，以便在任意路径下都可以快速执行hadoop命令

2修改文件：

　　文件1:---------------------------　

    conf/core-site.xml文件内容修改为下面内容：

　　<configuration>

     <!-- global properties 以下部分可以不用添加，在1.2.1的示例运行的时候回出现问题-->

     <property>

　　  <name>hadoop.tmp.dir</name>

　　  <value>/home/five/hadoop/tmp</value>

　　 </property>

    <!-- file system properties -->  hadoop核心配置文件，HDFS 的地址和端口号

　　 <property>

　　  <name>fs.default.name</name>

　　  <value>hdfs://localhost:9000</value>

　　 </property>

　　</configuration>

文件2:---------------------------

　conf/hdfs-site.xml文件内容修改为下面内容：(replication默认为3，如果不修改，datanode少于三台就会报错)

　　<configuration>

　　 <property>

　　  <name>fs.replication</name>

　　  <value>1</value>

　　 </property>

　　</configuration>

文件3:---------------------------

    这是Hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口。

　　conf/mapred-site.xml文件内容修改为下面内容：

　　<configuration>

　　 <property>

　　  <name>mapred.job.tracker</name>

　　  <value>localhost:9001</value>

　　 </property>

　　</configuration>

3 格式化Hadoop文件系统，在命令行输入命令：

　　bin/hadoop namenode -format

　　显示：15/03/16 15:43:46 INFO common.Storage: Storage directory /home/five/hadoop/hdfs/name has been successfully formatted.

　　上面命令如果有错，hadoop目录下执行，或者在环境变量中添加：hadoop的bin目录后，运行：hadoop namenode -format

4 、启动Hadoop，在命令行输入命令：

　　　　bin/start-all.sh
　　　　./start-all.sh
　　　　用bin/start-all.sh;也可以用bin/start-dfs.sh和bin/start-mapred.sh）

隔10秒后，因为可能会报错：
然后在命令行下输入：jps
发现有：
4574 TaskTracker
4630 Jps
2865 JobTracker
4237 DataNode
4394 SecondaryNameNode
4092 NameNode

6 验证Hadoop是否安装成功，在浏览器中输入下面网址，如果正常打开说明安装成功。

　　http://localhost:50030 (mapreduce的web页面)
　　http://localhost:50070 (hdfs的web页面)

错误信息：

1 http://localhost:50070 ，第二个打不开：

查看Logs:
2015-03-16 16:43:20,701 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode:
java.net.UnknownHostException: Invalid hostname for server: master

　　打开core-site.xml中的主机：看是不是正确，由于我之前写错了，

　　2 jps命令后，发现没有DataNode:可能是由于多次格式化NameNode造成

　　　　ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs

1.进入每个datanode的 dfs.data.dir 的 current目录，修改里面的文件VERSION

#Fri Nov 23 15:00:17 CST 2012
namespaceID=246015542
storageID=DS-2085496284-192.168.1.244-50010-1353654017403
cTime=0
storageType=DATA_NODE
layoutVersion=-32

里面有个 namespaceID 将其修改成为报错信息中的

namenode namespaceID = 971169702

相同的 namespaceID .

然后重新启动 datanode全部都能正常启动了。

4 运行示例：　

(1)先在本地磁盘建立两个输入文件 file01和file02
$echo "Hello World Bye World" > file01
$echo "Hello Hadoop Goodbye Hadoop" > file02
例如：我的是：/home/five/input : file01 file02

(2)在hdfs中建立一个input目录：$hadoop fs -mkdir input
(3)将file01和file02拷贝到hdfs中：
$hadoop fs -copyFromLocal /home/five/input/file0* input
(4)执行wordcount:
$hadoop jar hadoop/hadoop-examples-1.2.1.jar wordcount input hadoop/output

hadoop jar hadoop-examples-1.0.4.jar （指定例子所在jar包） wordcount （指定程序的名字） /user/hadoop/test-examples/world-count（输入参数） /user/hadoop/test-examples/world-count-result（输出结果）

Error：1：需要是安装目录下对应的版本：hadoop-examples-1.2.1.jar

　　　 2：如果提示创建Tem文件夹失败：删除那个在文件conf/core-site.xml中的属性

(5)完成之后，查看结果
$hadoop fs -cat hadoop/output/part-r-00000

显示如下信息：
.....
.....
15/03/17 15:16:24 INFO mapred.JobClient: map 0% reduce 0%
15/03/17 15:16:32 INFO mapred.JobClient: map 100% reduce 0%
15/03/17 15:16:40 INFO mapred.JobClient: map 100% reduce 33%
15/03/17 15:16:41 INFO mapred.JobClient: map 100% reduce 100%

5：参考：

http://www.linuxidc.com/Linux/2013-06/86106p2.htm
http://blog.csdn.net/wyswlp/article/details/10564847
http://www.cnblogs.com/forfuture1978/category/300670.html
http://www.linuxidc.com/Linux/2012-01/50880p2.htm

Hadoop环境搭建2_hadoop安装和运行环境的更多相关文章

ofbiz最新版13.07.01环境搭建、安装（linux环境下）
一.软件必备: 1.jdk1.7 2.mysql5.6 3.安装tomcat 二.安装: 1.安装 JDK1.7 2.安装mysql数据库 3.下载apache-ofbiz-13.07.01.zip ...
HHvm Apache 2.4 Nginx建站环境搭建方法安装运行WordPress博客
HHvm Apache 2.4 Nginx建站环境搭建方法安装运行WordPress博客 VPS主机 2014年06月02日 17:20 评论» 文章目录 Debian上安装 Ce ...
ElasticSearch 集群环境搭建，安装ElasticSearch-head插件，安装错误解决
ElasticSearch-5.3.1集群环境搭建,安装ElasticSearch-head插件,安装错误解决说起来甚是惭愧,博主在写这篇文章的时候,还没有系统性的学习一下ES,只知道可以拿来做全文 ...
Docker学习笔记之一，搭建一个JAVA Tomcat运行环境
Docker学习笔记之一,搭建一个JAVA Tomcat运行环境前言 Docker旨在提供一种应用程序的自动化部署解决方案,在 Linux 系统上迅速创建一个容器(轻量级虚拟机)并部署和运行应用程序 ...
SLAM+语音机器人DIY系列：（五）树莓派3开发环境搭建——1.安装系统ubuntu_mate_16.04
摘要通过前面一系列的铺垫,相信大家对整个miiboo机器人的DIY有了一个清晰整体的认识.接下来就正式进入机器人大脑(嵌入式主板:树莓派3)的开发.本章将从树莓派3的开发环境搭建入手,为后续ros开 ...
【Mac + Android】之Android Studio 环境搭建，AVD模拟器运行（包括：命令行运行AVD，并且Genymotion模拟器插件配置运行）
目录: 前提.Mac环境下手动配置Android SDK 一. Android Studio下载及配置二.AVD模拟器配置运行扩展:命令行运行AVD模拟器三.在Android Studio 中配 ...
阿里云服务器ubuntu安装java运行环境
服务器阿里云服务器ubuntu安装java运行环境转:http://www.codingyun.com/article/45.html 今天来给大家介绍一下在阿里云ubuntu服务器下安装java ...
摘：J2EE开发环境搭建(1)——安装JDK、Tomcat、Eclipse
J2EE开发环境搭建(1)——安装JDK.Tomcat.Eclipse 1:背景进公司用SSH(Struts,spring和hibernate)开发已经有两个月了,但由于一直要么只负责表示层的开发 ...
Python 2/3 安装与运行环境设置
Python 2/3 安装与运行环境设置: 1.Python 软件源:https://www.python.org/ 下载Win版本 https://www.python.org/downloa ...

随机推荐

C语言基础之注释与常见错误
总结起来,注释有三种: 1.单行注释 1: //哈哈单行注释 2.多行注释 1: /* 2: asdfasdfasdfasdfasdf 3: */ 其中多行注释如果这样写 1: /* 2: * 函数 ...
iOS开发 Swift开发数独游戏（一）
一.前言我姥姥是一名退休数学老师,一直很喜欢玩数独游戏.我以前答应过她要给她写一个数独游戏.本来计划是写一个Android应用的,但恰好我学了好长时间iOS开发一直没做什么"大项目&quo ...
WebStrom配置多个项目的Dweployment时，设置默认的启动配置
有时候,我们在WebStrom中打开多个项目,但是每个项目可能的Deployment的配置不同,所以每次在项目中时,可能打开的网页并不对.所以需要设置默认的启动的Deployment.下面的内容是设置 ...
3、列表 list
列表 >>> list=['aaa','bbb','ccc'] >>> print list ['aaa', 'bbb', 'ccc'] >>> ...
微博(MicroBlog)
ylbtech_Miscellaneos Inner 新浪微博 www.weibo.com 搜狐微博 http://t.sohu.com 网易微博 http://t.163.com/session ...
在使用springMVC时，我使用了@Service这样的注解，发现使用注解@Transactional声明的事务不起作用
问题出现的场景: 在使用spring mvc时,我使用了@Service这样的注解, 发现使用注解@Transactional声明的事务不起作用. 我的配置如下: <mvc:annotation ...
nginx静态资源配置
解决EE工程中静态文件显示问题在工程中本地测试没有问题,发现使用nginx配置了路径的页面,会获取不到相应页面的静态文件问题静态文件的路径类似为: http://localhost:8080/sa ...
【Hadoop】Hadoop mr wordcount基础
1.基本概念 2.Mapper package com.ares.hadoop.mr.wordcount; import java.io.IOException; import java.util.S ...
MySQL MID()函数用法
SQL MID() 函数用于得到一个字符串的一部分.这个函数被MySQL支持,但不被MS SQL Server和Oracle支持.在SQL Server, Oracle 数据库中,我们可以使用 SQL ...
zabbix自定义监控项一
1.在agent端配置 1.1 添加自定义监控项 zabbix中监控项叫做item,监控项的取值方法叫做key item: Items是从agnet主机里面获取的所有数据.通常情况下我叫itme为监控 ...

Hadoop环境搭建2_hadoop安装和运行环境

Hadoop环境搭建2_hadoop安装和运行环境的更多相关文章

随机推荐

热门专题