hadoop最简伪分布式安装

本次安装运行过程使用的是Ubuntu16.04 64位+Hadoop2.5.2+jdk1.7.0_75

Notice：

Hadoop2.5.2版本默认只支持64位系统

使用的jdk可以为1.7和1.8版本的

安装过程：

1. 下载安装jdk1.7.0_75

jourluohua@jourluohua-m:~/tools$ tar -xzvf jdk-7u75-linux-x64.tar.gz

2. 设置PATH等环境变量

jourluohua@jourluohua-m:~/tools$ sudo vi /etc/profile

在该文件下添加如下信息：

#set java environment

JAVA_HOME=/home/jourluohua/tools/jdk1.7.0_75

CLASSPATH=.:$JAVA_HOME/lib/tools.jar

PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOME CLASSPATH PATH

添加完成后，使环境变量生效

jourluohua@jourluohua-m:~/tools$ source /etc/profile

使用命令查看是否安装成功jdk

jourluohua@jourluohua-m:~/tools$ java –version

3. 下载安装hadoop-2.5.2.tar.gz

jourluohua@jourluohua-m:~/tools$ tar -xzvf hadoop-2.5.2.tar.gz

jourluohua@jourluohua-m:~/tools$ cd ./hadoop-2.5.2/

Notice:之后所有的运行操作都是在这个目录下完成的

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$

4. 格式化文件系统:

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ bin/hadoop namenode -format

5. 修改配置文件：

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ vi ./etc/hadoop/hadoop-env.sh

将export JAVA_HOME修改成(相对路径会报错)

export JAVA_HOME=/home/jourluohua/tools/jdk1.7.0_75

6. 确保你的sshd服务已经启动：

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ sudo /etc/init.d/ssh start

在这一步之后可以gen-key，作为一个安全通信协议（ssh生成密钥有rsa和dsa两种生成方式，默认情况下采用rsa方式），使用时需要密码，因此我们要设置成免密码登录，生成私钥和公钥，但是该步骤不是必须的，可以多输入几次密码，因此，没有添加到该教程中。

6.5 gen-key

切换到~目录

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cd ~

生成key

jourluohua@jourluohua-m:~$ ssh-keygen -t rsa

输入密码确认

切换到默认生成的ssh文件夹下

jourluohua@jourluohua-m:~/$ cd ./.ssh

生成相应的authorized文件

jourluohua@jourluohua-m:~/.ssh$ cp id_rsa.pub authorized_keys

切换回Hadoop目录

7. 开启dfs进程：

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ sbin/start-dfs.sh

这一步后，可以看到几个进程已经启动，如果出现connection refused错误，请回到第六步

8. 创建输入文件夹

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ mkdir input

9. 创建输入文件(这里将conf文件作为输入)：

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cp ./etc/hadoop/* ./input/

10. 运行官方的测试例子WordCount程序，并将结果保存到output中：

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jar wordcount input output

11. 查看运行结果

jourluohua@jourluohua-m:~/tools/hadoop-2.5.2$ cat output/*

hadoop最简伪分布式安装的更多相关文章

Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
hadoop+zookeeper+hbase伪分布式安装
基本安装步骤安装包下载从大数据组件下载地址下载以下组件安装包 hadoop-2.6.0-cdh5.6.0.tar.gz hbase-1.0.0-cdh5.6.0.tar.gz zookeeper- ...
指导手册02：伪分布式安装Hadoop(ubuntuLinux)
指导手册02:伪分布式安装Hadoop(ubuntuLinux) Part 1:安装及配置虚拟机 1.安装Linux. 1.安装Ubuntu1604 64位系统 2.设置语言,能输入中文 3.创建 ...
hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位二.实现Linux服务器联网功能网络适配器双击选择VMn ...
hadoop 0.20.2伪分布式安装详解
adoop 0.20.2伪分布式安装详解 hadoop有三种运行模式: 伪分布式不需要安装虚拟机,在同一台机器上同时启动5个进程,模拟分布式. 完全分布式至少有3个节点,其中一个做master,运行名 ...
Hadoop大数据初入门----haddop伪分布式安装
一.hadoop解决了什么问题 hdfs 解决了海量数据的分布式存储,高可靠,易扩展,高吞吐量mapreduce 解决了海量数据的分析处理,通用性强,易开发,健壮性 yarn 解决了资源管理调度二. ...
Hadoop开发第3期---Hadoop的伪分布式安装
一.准备工作 1. 远程连接工具的安装 PieTTY 是在PuTTY 基础上开发的,改进了Putty 的用户界面,提供了多语种支持.Putty 作为远程连接linux 的工具,支持SSH 和telne ...
Hadoop生态圈-hbase介绍-伪分布式安装
Hadoop生态圈-hbase介绍-伪分布式安装作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HBase简介 HBase是一个分布式的,持久的,强一致性的存储系统,具有近似最 ...
hadoop 2.7.3伪分布式安装
hadoop 2.7.3伪分布式安装 hadoop集群的伪分布式部署由于只需要一台服务器,在测试,开发过程中还是很方便实用的,有必要将搭建伪分布式的过程记录下来,好记性不如烂笔头. hadoop 2. ...

随机推荐

laravel 使用不同账号发送邮件的问题
业务背景: 公司自己做的oa系统,不同的模块需要用不同的邮箱发送信息给收件人.比如:员工离职的时候用离职的邮箱发送离职邮件通知,员工入职的时候用入职的邮箱发送入职邮件通知.发邮件是一件耗时的任务,如果 ...
Servlet请求参数的方式
今天整理了以下几种常用的Servlet请求参数的方式,下面简单地介绍 1)getParameter(String key)返回一个字符串,获得name和key 一样的表单控件的数据,如果有重复的nam ...
二、Java对返回参数进行处理（JSONObject，getJSONArray等）
一.根据返回参数格式获取其中的值 1.得到ResponseEntity<String> responseEntity对象 import org.springframework.http.R ...
golang网络通信超时设置
网络通信中,为了防止长时间无响应的情况,经常会用到网络连接超时.读写超时的设置. 本文结合例子简介golang的连接超时和读写超时设置. 1.超时设置 1.1 连接超时 func DialTimeou ...
SpringBoot 启动流程
SpringBoot 启动流程加载 resources/META-INF/spring.factories 中配置的 ApplicationContextInitializer 和 Applicat ...
DVM 和 JVM 的区别？
a) dvm 执行的是.dex 文件,而 jvm 执行的是.class.Android 工程编译后的所有.class 字节码会被 dex 工具抽取到一个.dex 文件中.b) dvm 是基于寄存器的虚 ...
LinkedList简介
原文:https://blog.csdn.net/GongchuangSu/article/details/51527042 LinkedList简介 LinkedList 是一个继承于Abstrac ...
如何修改jar包的某一个class
做了两年的开发,碰见了两次开源包的代码有问题,这次碰见的是wsdl4j.jar 具体问题以后再说,先说说如何修改其中的一个class 使用WinRAR打开(不是解压) 找到你要修改的class文件右 ...
frei0r-20190715-118a589 编译 frei0r 时注意事项
如果滤镜是 CPP 编写,需要选择 gcc Thread model: win32 模式,如果选择 posix 模式时,提示错误: 无法找到 dll 文件: frei0r-1.6.1-dlls-201 ...
QDataSet – 如何比较两个数据集内容的差异
QDataSet 提供了两个函数来比较两个数据集的差异,并将结果保存到第三个数据集. procedure Intersect(ASource1, ASource2: TQDataSet; AField ...

hadoop最简伪分布式安装

hadoop最简伪分布式安装的更多相关文章

随机推荐

热门专题