本次安装运行过程使用的是Ubuntu16.04 64位+Hadoop2.5.2+jdk1.7.0_75

Notice:

Hadoop2.5.2版本默认只支持64位系统

使用的jdk可以为1.7和1.8版本的

安装过程:

1. 下载安装jdk1.7.0_75

jourluohua@jourluohua-m:~/tools$ tar -xzvf jdk-7u75-linux-x64.tar.gz

2. 设置PATH等环境变量

jourluohua@jourluohua-m:~/tools$ sudo vi /etc/profile

在该文件下添加如下信息:

#set java environment

JAVA_HOME=/home/jourluohua/tools/jdk1.7.0_75

CLASSPATH=.:$JAVA_HOME/lib/tools.jar

PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOME CLASSPATH PATH

添加完成后,使环境变量生效

jourluohua@jourluohua-m:~/tools$ source /etc/profile

使用命令查看是否安装成功jdk

jourluohua@jourluohua-m:~/tools$ java –version

3. 下载安装hadoop-2.5.2.tar.gz

jourluohua@jourluohua-m:~/tools$ tar -xzvf hadoop-2.5.2.tar.gz

jourluohua@jourluohua-m:~/tools$ cd ./hadoop-2.5.2/

Notice:之后所有的运行操作都是在这个目录下完成的

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$

4. 格式化文件系统:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ bin/hadoop namenode -format

5. 修改配置文件:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ vi ./etc/hadoop/hadoop-env.sh

将export JAVA_HOME修改成(相对路径会报错)

export JAVA_HOME=/home/jourluohua/tools/jdk1.7.0_75

6. 确保你的sshd服务已经启动:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ sudo /etc/init.d/ssh start

在这一步之后可以gen-key,作为一个安全通信协议(ssh生成密钥有rsa和dsa两种生成方式,默认情况下采用rsa方式),使用时需要密码,因此我们要设置成免密码登录,生成私钥和公钥,但是该步骤不是必须的,可以多输入几次密码,因此,没有添加到该教程中。

6.5 gen-key

切换到~目录

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cd ~

生成key

jourluohua@jourluohua-m:~$ ssh-keygen -t rsa

输入密码确认

切换到默认生成的ssh文件夹下

jourluohua@jourluohua-m:~/$ cd ./.ssh

生成相应的authorized文件

jourluohua@jourluohua-m:~/.ssh$ cp id_rsa.pub authorized_keys

切换回Hadoop目录

7. 开启dfs进程:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ sbin/start-dfs.sh

这一步后,可以看到几个进程已经启动,如果出现connection refused错误,请回到第六步

8. 创建输入文件夹

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ mkdir input

9. 创建输入文件(这里将conf文件作为输入):

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cp ./etc/hadoop/* ./input/

10. 运行官方的测试例子WordCount程序,并将结果保存到output中:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jar wordcount input output

11. 查看运行结果

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cat output/*

hadoop最简伪分布式安装的更多相关文章

  1. Hadoop单机和伪分布式安装

    本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境 操作系统 Centos 6.5_64bit   本机名称 hadoop001   本机IP ...

  2. hadoop+zookeeper+hbase伪分布式安装

    基本安装步骤 安装包下载 从大数据组件下载地址下载以下组件安装包 hadoop-2.6.0-cdh5.6.0.tar.gz hbase-1.0.0-cdh5.6.0.tar.gz zookeeper- ...

  3. 指导手册02:伪分布式安装Hadoop(ubuntuLinux)

    指导手册02:伪分布式安装Hadoop(ubuntuLinux)   Part 1:安装及配置虚拟机 1.安装Linux. 1.安装Ubuntu1604 64位系统 2.设置语言,能输入中文 3.创建 ...

  4. hadoop伪分布式安装之Linux环境准备

    Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMn ...

  5. hadoop 0.20.2伪分布式安装详解

    adoop 0.20.2伪分布式安装详解 hadoop有三种运行模式: 伪分布式不需要安装虚拟机,在同一台机器上同时启动5个进程,模拟分布式. 完全分布式至少有3个节点,其中一个做master,运行名 ...

  6. Hadoop大数据初入门----haddop伪分布式安装

    一.hadoop解决了什么问题 hdfs 解决了海量数据的分布式存储,高可靠,易扩展,高吞吐量mapreduce 解决了海量数据的分析处理,通用性强,易开发,健壮性 yarn 解决了资源管理调度 二. ...

  7. Hadoop开发第3期---Hadoop的伪分布式安装

    一.准备工作 1. 远程连接工具的安装 PieTTY 是在PuTTY 基础上开发的,改进了Putty 的用户界面,提供了多语种支持.Putty 作为远程连接linux 的工具,支持SSH 和telne ...

  8. Hadoop生态圈-hbase介绍-伪分布式安装

    Hadoop生态圈-hbase介绍-伪分布式安装 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HBase简介 HBase是一个分布式的,持久的,强一致性的存储系统,具有近似最 ...

  9. hadoop 2.7.3伪分布式安装

    hadoop 2.7.3伪分布式安装 hadoop集群的伪分布式部署由于只需要一台服务器,在测试,开发过程中还是很方便实用的,有必要将搭建伪分布式的过程记录下来,好记性不如烂笔头. hadoop 2. ...

随机推荐

  1. LeetCode 168. Excel表列名称(Excel Sheet Column Title)

    题目描述 给定一个正整数,返回它在 Excel 表中相对应的列名称. 例如, 1 -> A 2 -> B 3 -> C ... 26 -> Z 27 -> AA 28 - ...

  2. 前端学习框架之layui

    学习地址:https://www.layui.com/demo/laytpl.html

  3. 深度学习----现今主流GAN原理总结及对比

    原文地址:https://blog.csdn.net/Sakura55/article/details/81514828 1.GAN 先来看看公式:             GAN网络主要由两个网络构 ...

  4. Keepalived + LVS-NAT 实现高可用四层 TCP/UDP 负载均衡器

    目录 文章目录 目录 前文列表 在 LVS1/2 安装 Keepalived & LVS Keepalived + LVS-NAT 实现 TCP 负载均衡 IP 规划 网络架构参考 LVS1 ...

  5. OpenCL32 for mingw

    OpenCL32 for MinGW 最新版本 2019.05.25 从 CUDA_Toolkit_10.1.168_425.25_win10 中提取的头文件和库文件: 链接: https://pan ...

  6. Hibernate 持久化对象和一级缓存

    关于如何手动创建Hibernate,Hibernate初了解已经介绍了,接下来了解持久化对象和一级缓存. Hibernate的持久化类有三种状态: 1.Transient瞬时态:持久化对象没有唯一标识 ...

  7. LeetCode.927-独特邮箱地址(Unique Email Addresses)

    这是悦乐书的第356次更新,第383篇原创 01看题和准备 今天介绍的是LeetCode算法题中Easy级别的第218题(顺位题号是927).每封电子邮件都包含本地名称和域名,以@符号分隔. 例如,在 ...

  8. awk 控制语句if-else

    语法: 一.if (条件){语句}[else 语句] 单分支 二.if (条件){语句}else if( 条件){语句} 多分支 示例: .[root@localhost ~]# awk -F: '{ ...

  9. 关于confusion_matrix()返回的矩阵的索引顺序(类别顺序)

    转载至:https://blog.csdn.net/m0_38061927/article/details/77198990 1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵 ...

  10. 【生成树趣题】CF723F st-Spanning Tree

    题目传送门 题意: 给定一个n个点m条边的无向联通图,没有重边和自环.给定s和t,求一棵生成树,使得s,t的度数不超过ds,dt.若有解,输出“Yes”和方案(多组方案输出任意一组),若无解,输出“N ...