操作系统:centos6.6(一台服务器)

环境:selinux disabled;iptables off;java 1.8.0_131

安装包:hadoop-2.5.0.tar.gz

伪分布式环境(适用于学习环境)

安装步骤:

1、解压安装包

  # tar zxvf hadoop-2.5.0.tar.gz  -C   /data/hadoop/hadoopfake/

2、配置hadoop参数

  1)设置环境变量  #vim /etc/profile

    

    追加下面两行:

    export HADOOP_HOME=/data/hadoop/hadoopfake/hadoop-2.5.0

    export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

    #source /etc/profile   使环境变量生效

    #echo $HADOOP_HOME  验证hadoop参数

    

  2)设置JAVA_HOME参数

    分别修改/data/hadoop/hadoopfake/hadoop-2.5.0/etc/hadoop/下的hadoop-env.sh、mapred-env.sh、yarn-env.sh文件的JAVA_HOME参数

    (如果JAVA_HOME在/etc/expofile或者~/.bashrc设置了环境变量export  JAVA_HOME,那以上文件不用修改JAVA_HOME的参数)

  3)配置core-site.xml文件

    #vim  /data/hadoop/hadoopfake/hadoop-2.5.0/etc/hadoop/core-site.xml

    

    fs.defaultFS参数设置的是hdfs的地址;

    hadoop.tmp.dir设置的是hadoop的临时目录,例如namenode的数据都会默认存放在这个目录;如果不配置这个参数,namenode数据会默认放在/tmp/hadoop*目录下,操作系统重启这个目录的所有数据都会清空,namenode的元数据会丢失,所以最好新建目录存放namenode的元数据。

  4)配置hdfs-site.xml文件

    #vim /data/hadoop/hadoopfake/hadoop-2.5.0/etc/hadoop/hdfs-site.xml

    

    dfs.replication配置的是HDFS存储时的备份数量,伪分布式环境只有一个节点,所以设置为1就可以。

3、格式化、启动HDFS

  #/data/hadoop/hadoopfake/hadoop-2.5.0/bin/hdfs namenode -format  格式化hdfs

  

  #ll /data/hadoop/hadoopfake/tmp/dfs/name/current   查看格式化后的目录

  

  格式化是对分布式文件系统HDFS中的datanode进行分块,统计所有分块后的初始元数据存储在namenode中

  格式化后hadoop.tmp.dir下面有dfs目录则格式化成功

  fsimage是namenode元数据在内存满了后,持久化保存到文件

  fsimage*md5是校验文件,用于校验fsimage的完整性

  seen_txid是hadoop的版本

  VERSION:namespaceID是namenode的唯一ID

         clusterID是集群的ID,namenode和datanode集群ID一致时表明是一个集群

4、启动namenode

  #/data/hadoop/hadoopfake/hadoop-2.5.0/sbin/hadoop-daemon.sh start namenode

  

5、启动datanode

  #/data/hadoop/hadoopfake/hadoop-2.5.0/sbin/hadoop-daemon.sh start datanode

  

6、启动secondarynamenode

  #/data/hadoop/hadoopfake/hadoop-2.5.0/sbin/hadoop-daemon.sh start secondarynamenode

  

7、使用jps命令查看node是否启动

  #jps

  

8、测试创建目录,上传文件

  #hadoop fs -mkdir /demo1

  

  #hadoop fs -put /etc/passwd  /demo1

  #hadoop fs -cat /demo1/passwd    读取文件内容

  

  #hadoop fs -get /demo1/passwd

  

9、配置启动YARN

  1)配置mapred-site.xml

    #cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

       #vim  etc/hadoop/mapred-site.xml

  

  指定mapreduce运行在yarn框架上

  2)配置yarn-site.xml

  #vim etc/hadoop/yarn-site.xml

  

  yarn.nodemanager.aux-services配置了yarn的默认混洗方式,选择为mapreduce的默认混洗算法

  yarn.resourcemanager.hostname指定了Resourcemanager运行在哪个节点上

  3)启动Resourcemanager

  #vim  /etc/hosts

  

  #/sbin/yarn-daemon.sh start resourcemanager

  

  #jps

  

  4)启动nodemanager

  #/sbin/yarn-daemon.sh start nodemanager

  

  #jps

  

  5)web界面

  

10、运行mapreduce job

  1)创建输入目录

  #hadoop fs -mkdir -p /wordcountdemo/input

  

  2)创建文件并上传到/wordcountdemo/input目录中

  #cat wc.input

  

  #hadoop fs -put wc.input  /wordcountdemo/input/

  

  3)运行wordcount mapreduce job

  #bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-example-2.5.0.jar wordcount /wordcountdemo/input /wordcountdemo/output

  

  #hadoop fs -ls /wordcountdemo/output   查看输出结果

  _SUCCESS文件是个空文件,只是来说明job执行成功

  part-r-00000是结果文件,-r-说明这个文件是reduce阶段产生的结果,如没有reduce则应该是-m-

  #hadoop fs -cat /wordcountdemo/output/part-r-00000   查看输出文件内容

  

11、停止hadoop

  #sbin/hadoop-daemon.sh stop namenode

  #sbin/hadoop-daemon.sh stop datanode

  #sbin/hadoop-daemon.sh stop secondarynode

  #sbin/yarn-daemon.sh stop resourcemanager

  #sbin/yarn-daemon.sh stop nodemanager

12、开启历史服务

  开启历史服务可在web界面上查看yarn上执行的job情况等信息

  #sbin/mr-jobhistory-daemon.sh start historyserver

  

  正在执行中的任务

  

  

centos6.6安装hadoop-2.5.0(二、伪分布式部署)的更多相关文章

  1. Ubuntu 14.04 LTS 安装 spark 1.6.0 (伪分布式)-26号开始

    需要下载的软件: 1.hadoop-2.6.4.tar.gz 下载网址:http://hadoop.apache.org/releases.html 2.scala-2.11.7.tgz 下载网址:h ...

  2. Hadoop三种安装模式:单机模式,伪分布式,真正分布式

    Hadoop三种安装模式:单机模式,伪分布式,真正分布式 一 单机模式standalone单 机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守 ...

  3. 超详细!CentOS 7 + Hadoop3.0.0 搭建伪分布式集群

    超详细!CentOS 7 + Hadoop3.0.0 搭建伪分布式集群 ps:本文的步骤已自实现过一遍,在正文部分避开了旧版教程在新版使用导致出错的内容,因此版本一致的情况下照搬执行基本不会有大错误. ...

  4. CentOS7.0分布式安装HADOOP 2.6.0笔记-转载的

    三台虚拟机,IP地址通过路由器静态DHCP分配 (这样就无需设置host了). 三台机器信息如下 -      1. hadoop-a: 192.168.0.20  #master     2. ha ...

  5. 安装hadoop 2.2.0

    安装环境为 CentOS 64位系统, 大概分下面几个步奏, 0. 安装JDK1. 配置SSH2. 配置/etc/hosts3. 拷贝hadoop包到没台机器上4. 修改hadoop配置文件5. 关闭 ...

  6. hadoop 2.6.0 伪分布式部署安装遇到的问题

    之前读到了一篇关于配置安装hadoop的博文(地址:http://www.powerxing.com/install-hadoop/)能正确安装和运行,但是在网页进行Jobtracker监控时,输入l ...

  7. Ubuntu 13.10下Hadoop 2.2 安装、配置、编译(伪分布式)

    1.安装JDK.在此不做解说,上篇博文里已介绍过.http://www.cnblogs.com/lifeinsmile/p/3578677.html 2.配置ssh. ssh服务,用于管理远程Hado ...

  8. Hadoop1.0.4伪分布式安装

    前言: 目前,学习hadoop的目的是想配合其它两个开源软件Hbase(一种NoSQL数据库)和Nutch(开源版的搜索引擎)来搭建一个知识问答系统,Nutch从指定网站爬取数据存储在Hbase数据库 ...

  9. hadoop2.2.0 单机伪分布式(含64位hadoop编译) 及 eclipse hadoop开发环境搭建

    hadoop中文镜像地址:http://mirrors.hust.edu.cn/apache/hadoop/core/hadoop-2.2.0/ 第一步,下载 wget 'http://archive ...

随机推荐

  1. 【洛谷p2822】组合数问题

    (突然想          ??忘掉了wdt) (行吧那就%%%hmr) 组合数问题[传送门] (因为清明要出去培训数学知识所以一直在做数论) 组合数<=>杨辉三角形(从wz那拐来的技能 ...

  2. ddt 实例

    from :https://blog.csdn.net/wushuai150831/article/details/78453549

  3. CentOS下yum命令详解

    CentOS下yum命令详解 Yum: 即Yellowdog Update Modifier,是一种基于rpm的包管理工具 yum命令使用示例 显示yum仓库 显示所有仓库 yum repolist ...

  4. 各种排序算法(java)

    /** * 时间复杂度:O(n*n) * 简单选择排序法:每次从剩余元素中选择一个最小值,交换最小值与数组中相应位置上的数值 * n趟 * @param nums */ public static v ...

  5. 第一阶段——站立会议总结DAY09

    1.昨天做了什么:未做. 2.今天准备做什么:准备将之前讲的东西,要付诸实践.所以,为了使界面更加耐看,向微信,QQ这样的看齐,查一查个人中心界面中间的条条框框的实现代码,借鉴,并运用到自己的代码上. ...

  6. const constptr 和引用的盲点(未解决)

    #include<iostream> //const 和 引用的值必须初始化 //等号左侧是const或者const和引用,右侧可以是数字,普通变量-等号左侧是const和指针,右侧必须是 ...

  7. 剑指offer-调整数组内奇偶数顺序

    题目描述 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变. 解题思路 时间换 ...

  8. introsort(内省排序)

    本文转载于:https://blog.csdn.net/sky453589103/article/details/51116264 快速排序是一种很快的算法,它平均的时间复杂度WieO(nlgn), ...

  9. Hadoop---HDFS读写流程

    Hadoop---HDFS HDFS 性能详解 HDFS 天生是为大规模数据存储与计算服务的,而对大规模数据的处理目前还有没比较稳妥的解决方案. HDFS 将将要存储的大文件进行分割,分割到既定的存储 ...

  10. CentOS 7使用yum安装SNMP教程

    一.安装SMNP yum install -y net-snmp net-snmp-utils 可以理解为net-snmp是服务端,net-snmp-utils是客户端工具集:如果机器上只需要搭建服务 ...