Hadoop单点伪分布模式安装

概述

单点

single-node,单节点,即一台计算机。

伪分布式模式

pseudo-distributed mode

所谓集群,表面上看是多台计算机联合完成任务;但本质上是由分布到很多计算机上的很多进程联合完成任务的。因为多台计算机部署比较复杂,需要的硬件配置也比较高,故障率也比较高,所以就产生了伪分布的需求,即在一台计算机上运行本应该分布到多台计算机上的进程。伪分布模式有利于快速体验Hadoop的特性或简化开发调试过程。

安装JDK

点击打开链接

生成SSH密钥对

ssh-keygen -t rsa                 

#一路回车即可

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

#将生成的公钥添加到授权公钥中

设置主机解析

打开/etc/hosts,全部内容修改为:

127.0.0.1   localhost

::1localhost

127.0.0.1centos

重启

shutdown -r now

测试

ssh centos

提示时输入yes,没有出错即是成功

安装Hadoop

安装

到Hadoop官方下载 hadoop-xxx.tar.gz(选择稳定版)

上传到 /usr/tmp

解压提取 tar zxvf hadoop-xxx.tar.gz

将得到的/usr/tmp/hadoop-xxx…移动到/usr/share/hadoop中

修改Hadoop配置文件

1)打开Hadoop目录中etc/hadoop/hadoop-env.sh,找到并修改JAVA_HOME变量

# The java implementation to use.

export JAVA_HOME=/usr/share/jdk1.8.0_144
   #指定JDK安装位置

2)打开Hadoop目录中etc/hadoop/core-site.xml,修改为

<configuration>

    <property>

        <name>fs.defaultFS</name>              

        <value>hdfs://centos:9000</value>

    </property>

</configuration>

3) 打开Hadoop目录中etc/hadoop/hdfs-site.xml,修改为

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>

配置环境变量

打开/etc/profile,在最后添加(最外层的etc下面)

#Hadoop

export HADOOP_HOME=/usr/share/hadoop

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

重新执行使新环境变是生效

source /etc/profile

格式化和启动HDFS 

格式化

在Hadoop目录中运行(最外层的hadoop文件夹)

hdfs namenode -format

没有ERROR就是成功

启动

start-dfs.sh

测试

hdfs dfs -mkdir /temp

hdfs dfs -ls /

应该打印出一条文件夹记录

Hadoop单点伪分布模式安装的更多相关文章

  1. Hadoop学习笔记(3)hadoop伪分布模式安装

    为了学习这部分的功能,我们这里的linux都是使用root用户登录的.所以每个命令的前面都有一个#符号. 伪分布模式安装步骤: 关闭防火墙 修改ip地址 修改hostname 设置ssh自动登录 安装 ...

  2. Spark新手入门——2.Hadoop集群(伪分布模式)安装

    主要包括以下三部分,本文为第二部分: 一. Scala环境准备 查看 二. Hadoop集群(伪分布模式)安装 三. Spark集群(standalone模式)安装 查看 Hadoop集群(伪分布模式 ...

  3. 伪分布模式安装hadoop

    准备工具: 虚拟机:VMware Linux系统:CentOS hadoop-1.1.2.tar.gz jdk-7u75-linux-x64.gz CentOS的网络配置 1.设置主机中VMware ...

  4. Hadoop 伪分布模式安装

    ( 温馨提示:图片中有id有姓名,不要盗用哦,可参考流程,有问题评论区留言哦 ) 一.任务目标 1.了解Hadoop的3种运行模式 2.熟练掌握Hadoop伪分布模式安装流程 3.培养独立完成Hado ...

  5. Hadoop开发第3期---Hadoop的伪分布式安装

    一.准备工作 1. 远程连接工具的安装 PieTTY 是在PuTTY 基础上开发的,改进了Putty 的用户界面,提供了多语种支持.Putty 作为远程连接linux 的工具,支持SSH 和telne ...

  6. hadoop伪分布模式安装

    软件环境 操作系统 :  OracleLinux-R6-U6 主机名: hadoop java: jdk1.7.0_75 hadoop: hadoop-2.4.1 环境搭建 1.软件安装 由于所需的软 ...

  7. linux环境tomcat配置及hadoop 2.6伪分布模式安装配置

    一.ubuntu 15.04.openjdk1.7.tomcat7环境配置 1. 配置openjdk1.7,输入命令: -jdk 2. 查看java是否安装成功,输入命令: envjava -vers ...

  8. Hadoop之伪分布式安装

    一.Hadoop的安装模式有3种 ①单机模式:不能使用HDFS,只能使用MapReduce,所以单击模式主要用于测试MR程序. ②伪分布式模式:用多个线程模拟真实多台服务器,即模拟真实的完全分布式环境 ...

  9. hadoop(三)伪分布模式hdfs文件处理|5

    伪分布模式hdfs 1.启动hsfs 2. 编辑vi hadoop-env.sh image.png image.png 3.配置nameNode和生产文件第地址 [shaozhiqi@hadoop1 ...

随机推荐

  1. [转]sql:除非另外还指定了 TOP 或 FOR XML,否则,ORDER BY 子句在视图、内联函数、派生表、子查询

    执行sql语句: select * from ( select * from tab where ID>20 order by userID desc ) as a order by date ...

  2. mysqldump全量备份+mysqlbinlog二进制日志增量备份

    日常的数据备份及恢复测试,是DBA工作重中之重的事情,所以要做好备份及测试,日常的备份常见有mysqldump+binlog备份.xtrabackup+binlog备份,无论那一种,几乎都少不了对bi ...

  3. 点滴积累【JS】---JS实现动画闪烁效果

    效果: 思路:首先获得图片数组,然后做JS定时用setTimeout和setInterval在用显示隐藏实现闪烁效果. 代码: <!DOCTYPE html PUBLIC "-//W3 ...

  4. linode使用apt更新时停止的错误

    使用ubuntu在更新系统时候,有时候会出现这样的问题: 0% [Connecting to security.ubuntu.com (2001:67c:1560:8001::14)] 问了下客户,他 ...

  5. DB2检测表字段改动的方法(不用触发器)

    ALTER TABLE TEST ADD COLUMN RTS TIMESTAMP NOT NULL GENERATED ALWAYS FOR EACH ROW ON UPDATE AS ROW CH ...

  6. Observable 示例之 Windows Phone 列表内项目逐个加载

    在写 Windows phone应用性能优化(一)的时候,在 ListBox 的项加载的时候,添加了一些简单的动画. 其实在 Windows Phone 的应用中使用 Blend 设计动画是很容易的, ...

  7. 一款基于jQuery的图片下滑切换焦点图插件

    之前为大家分享了好多款jquery插件,今天我们要分享的一款jQuery插件也比较实用,是一款jQuery焦点图插件.焦点图相当普通,一共可以循环播放4张图片,并且每一张图片在切换的时候都是向下滑动的 ...

  8. C#中利用JQuery实现视频网站的缩略图采集

    最近有朋友想要采集优酷的视频标题和缩略图 (哈哈, 并非商业目的). 找到我帮忙, 考虑到有我刚刚发布的SpiderStudio, 我毫不犹豫的答应了. 首先在网页上视频的基本结构为: div.v - ...

  9. spark 系列文章汇总

    源码导读 spark 源码导读1 从spark启动脚本开始 spark 源码导读2 进一步窥探Master.Worker启动及通信机制 spark 源码导读3 进一步理解脚本调用关系 spark 源码 ...

  10. SQL里3个表的连接查询

    两种:1.select * from 表1,表2,表3 where 表1.字段=表2.字段 and 表1.字段=表3.字段这种效率比较低 结构简单数据量小可以采用2.select * from 表1 ...