Hadoop单点安装,基于版本2.7.1，

在一台Lunix主机上面安装Hdoop，

包括Hdfs的NameNode和DataNode，

以及Yarn的ResouceManager和NodeManager。

1.安装规划

vi /etc/hosts

10.43.159.7 zdh-7

useradd -g hadoop -s /bin/csh -md /home/hdfsone hdfsone

hdfsone/zdh1234

2.配置文件

登陆hdfsone用户，

安装jdk，修改.bashrc文件，配置jdk目录:

export JAVA_HOME=/usr/java/jdk1.8.0_151

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

配置hadoop的安装目录：

export HADOOP_HOME=/home/hdfsone/hadoop-2.7.1

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

3.配置ssh，实现免密登陆

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

必须修改权限，否则无法免秘登陆

chmod 600 ~/.ssh/authorized_keys

验证无密码登陆

ssh localhost

注意，本步骤单机也需要配置的，在启动脚本中会用到相应的功能。

4.安装rsync

使用如下命令查看是否已经安装,一般都有:

type rsync

5.解压hadoop

tar -zxvf hadoop-2.7.1.tar.gz

6.配置伪分布模式

修改etc/hadoop/core-site.xml如下：

<property>

<name>fs.defaultFS</name>

<value>hdfs://10.43.159.7:9000</value>

</property>

修改etc/hadoop/hdfs-site.xml如下：

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

    <name>dfs.namenode.name.dir</name>

    <value>file:/home/hdfsone/dfs/name</value>

</property>

<property>

    <name>dfs.datanode.data.dir</name>

    <value>file:/home/hdfsone/dfs/data</value>

</property>

<property>

  <name>dfs.namenode.rpc-address</name>

  <value>10.43.159.7:9000</value>

  <description>

    RPC address that handles all clients requests. In the case of HA/Federation where multiple namenodes exist,

    the name service id is added to the name e.g. dfs.namenode.rpc-address.ns1

    dfs.namenode.rpc-address.EXAMPLENAMESERVICE

    The value of this property will take the form of nn-host1:rpc-port.

  </description>

</property>

<property>

  <name>dfs.namenode.secondary.http-address</name>

   <value>10.43.159.7:40090</value>

   <description>

        The secondary namenode http server address and port.

   </description>

</property>

注意：core-site.xml的fs.defaultFS的端口要和hdfs-site.xml的dfs.namenode.rpc-address一致，以rpc配置的端口开启监听

7.初始化并且启动hdfs

格式化namenode，修改完配置后执行：

hdfs namenode -format

dfs/name等目录不存在会自动新建

启动hdfs服务：

start-dfs.sh

停止hdfs服务：

stop-dfs.sh

hdfs的web管理页面：

http://10.43.159.7:50070

hdfs服务地址：

hdfs://10.43.159.7:9000

查看namenodes节点：

hdfs getconf -namenodes

8.配置yarn

cp mapred-site.xml.template mapred-site.xml

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

yarn-site.xml

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

启动yarn服务：

start-yarn.sh

停止yarn服务：

stop-yarn.sh

yarn的web管理页面：

http://10.43.159.7:8088/

9.验证hdfs安装

创建目录

hadoop fs -mkdir /user

列出根目录

hadoop fs -ls /

10.验证yarn安装

后台执行mapreduce任务，可以在yarn的web管理页面查看到：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount input/wordcount /user/wordresult

11.参考文章

http://www.aboutyun.com/thread-12798-1-1.html

Hadoop单点安装(伪分布式)的更多相关文章

hadoop一键安装伪分布式
hadoop伪分布式和hive在openSUSE中的安装在git上的路径为:https://github.com/huabingood/hadoop--------/tree/master 各个文件 ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop
一．实验目的 1. 掌握Linux虚拟机的安装方法. 2. 掌握Hadoop的伪分布式安装方法. 二．实验内容 (一)Linux基本操作命令 Linux常用基本命令包括: ls,cd,mkdir,rm ...
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode)
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载相应的jdk和Hadoop安装包 JDK:h ...
使用Docker搭建Hadoop集群(伪分布式与完全分布式)
之前用虚拟机搭建Hadoop集群(包括伪分布式和完全分布式:Hadoop之伪分布式安装),但是这样太消耗资源了,自学了Docker也来操练一把,用Docker来构建Hadoop集群,这里搭建的Hado ...
Hadoop学习2—伪分布式环境搭建
一.准备虚拟环境 1. 虚拟环境网络设置 A.安装VMware软件并安装linux环境,本人安装的是CentOS B.安装好虚拟机后,打开网络和共享中心 -> 更改适配器设置 -> 右键V ...
避坑之Hadoop安装伪分布式(Hadoop3.2.0/Ubuntu14.04 64位)
一.安装JDK环境(这个可以网上随意搜一篇教程了照着弄,这里不赘述) 安装成功之后输入输入:java -version 显示如下说明jdk安装成功(我这里是安装JDK8) 二.安装Hadoop3. ...
Win10环境下Hadoop(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)
一.本文思路 [1].配置java环境–JDK12(Hadoop的底层实现语言是java,hadoop运行需要JDK环境) [2].安装Hadoop 1.解压hadop 2.配置hadoop环境变量 ...
CentOS7上安装伪分布式Hadoop
1.下载安装包下载hadoop安装包官网地址:https://hadoop.apache.org/releases.html 版本:建议使用hadoop-2.7.3.tar.gz 系统环境:Cen ...

随机推荐

zabbix实现对主机和Tomcat监控
#:在tomcat服务器安装agent root@ubuntu:~# apt install zabbix-agent #:修改配置文件 root@ubuntu:~# vim /etc/zabbix/ ...
Java_zip_多源文件压缩到指定目录下
依赖:  <depend ...
JVM堆空间结构及常用的jvm内存分析命令和工具
jdk8之前的运行时数据区域程序计数器是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器.每个线程都有一个独立的程序计数器,这类内存区域为"线程私有",此内存 ...
07-Spring5 WebFlux响应式编程
SpringWebFlux介绍简介 SpringWebFlux是Spring5添加的新模块,用于Web开发,功能和SpringMvc类似的,WebFlux使用当前一种比较流行的响应式编程框架使用传 ...
Python绘制柱状图
1.1Python绘制柱状图对应代码如下所示 import matplotlib.pyplot as plt import numpy as np from pylab import mpl mpl. ...
[BUUCTF]REVERSE——findit
findit 步骤: apk文件,直接用apkide打开,找到findit文件查看了所有的函数,没找到有关flag的线索,但是找到了一串奇怪的16进制将第一串转换一下,感觉第二串应该是flag 拿 ...
java 编程基础类加载器
什么是类加载器类加载器负责将class文件(可能在磁盘上,也可能在网络上)加载到内存中,并为之生成对应的java.lang.Class对象.Java开发中无须过分关心类加载机制,但所有的编程人员都应 ...
java 多线程：ThreadLocal 共享变量多线程不同值方案；InheritableThreadLocal变量子线程中自定义值，孙线程可继承
ThreadLocal类的使用变量值的共享可以使用public static变量的形式,所有的线程都是用同一个public static变量.如果想实现每一个线程都有自己的值.该变量可通过Thr ...
Uni-app原生插件入门使用教程「2」：如何离线使用原生插件
当HBuilderX中提供的能力无法满足App功能需求,需要通过使用Andorid/iOS原生开发实现时,可使用App离线SDK开发原生插件来扩展原生能力. 如使用Uniapp开发直播功能时,需要调用 ...
ABP VNext框架中Winform终端的开发和客户端授权信息的处理
在ABP VNext框架中,即使在它提供的所有案例中,都没有涉及到Winform程序的案例介绍,不过微服务解决方案中提供了一个控制台的程序供了解其IDS4的调用和处理,由于我开发过很多Winform项 ...

Hadoop单点安装(伪分布式)