文章更新于:2020-3-24

按照惯例,需要的文件附上链接放在文首

文件名:Java SE Development Kit 8u241

文件大小:72 MB+

下载链接:https://www.oracle.com/java/technologies/javase-jdk8-downloads.html

SHA256:不同文件hash不同,请在上方网址中自行查看。

文件名:hadoop-3.2.1.tar.gz

文件大小:243MB

下载链接:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

SHA256:f66a3a4115b8f16c1077d1a198a06854dbef0e4233291712ed08d0a10629ed37

一、先安装ssh

1、查看是否安装

ps -aux|grep ssh先查看有没有ssh进程。



发现只匹配到了grep ssh进程,也就是说,现在系统里面并没有与ssh相关的进程。

2、进行ssh服务端安装

这时我们使用sudo apt install openssh-server命令来安装ssh



然后,等待安装完成。

3、尝试登录

安装完成以后,我们先来测试一下能不能连到本机。



如上图,红框1是ssh首次登录提示。

红框2是提示输入ssh目标机器的密码。

密码验证通过后就登录成功了。

这样,输入密码我们就可以登录到目标机器了。

4、配置无密码登录

但是,为了更简便,我们还可以配置无密码登录,也就是将本机的公钥加到目标机器的授权文件中。

本机的公钥在~/.ssh中,上传到目标机器的.ssh/authorized_keys中

本机的私钥和公钥可以通过ssh-keygen -t rsa来生成,出现提示一路回车即可。



从上图可以看到,我们已经成功生成了id_rsa私钥文件和id_rsa.pub公钥文件。

因为此时我们要测试的目标机器就是本机,所以我们需要将本机的公钥文件放到本机的authorized_keys授权文件中,但从上图来看,并没有这个文件,这是因为我们还没有用过这个文件,所以还没有生成,我们手动生成一个就行。

我们使用cat id_rsa.pub >> authorized_keys命令来将本机公钥id_rsa.pub的内容追加到本机授权文件authorezed_keys中。



从上图可以看出,本机的授权文件和本机公钥文件是一样大小的,因为此时我们的授权文件中只有自己的公钥。而如果其他机器想要无密码登录到本机,则将其公钥追加到本机的授权文件中即可。注意,是追加,不是覆盖。如果覆盖掉了其他机器的公钥,其他机器将不能再登录到本机。

此时,我们测试一下无密码登录是否可用。



从上图可以看到,我们使用ssh命令登录,系统不再要求我们提供密码。这是因为我们机器的公钥已经在目标机器(这里还是本机)的授权文件中了。

二、安装Java环境

1、方法一:在线安装

这里我们使用sudo apt intall default-jre default-jdk命令来安装Java环境



等待安装完成。

2、方法二:手动安装

官网安装手册说明如下:



1、需要先下载好安装包这里使用的是jdk-8u241-linux-x64.tar-gz

2、然后解压到你想要安装的目录。

3、配置环境变量

1、这时我们使用vi ~/.bashrc来配置JAVA_HOME、PATH等环境变量。



2、然后,在第一行加上

注:这里的jdk1.8是我的java安装路径,你需要改成你的。

export JAVA_HOME=/usr/local/jdk1.8/
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tool.jar



3、然后使用source ~./bashrc使命令立即生效



最后使用java -version查看是否安装成功

如上图,JAVA环境已经配置成功。

三、安装hadoop

1、检查文件的md5、sha512

# Check HashSum
md5sum hadoop-3.2.1.tar.gz
sha512sum hadoop-3.2.1.tar.gz
sha256sum hadoop-3.2.1.tar.gz
sha1sum hadoop-3.2.1.tar.gz

2、解压文件 == 安装程序

我们可以先在宿主机下载好hadoop文件,然后拷贝虚拟机共享文件夹。或者直接用wget在线获取文件。

这里我们使用第一种方法。



等待安装完成

3、更改文件名

进入/usr/local并将hadoop-3.2.1更名为hadoop

4、更改所有者

更改文件权限,并查看版本信息



咦?发现报错了。提示JAVA_HOME的路径不存在

待续

2019年10月25日续

文章于2020-03-24再次更新时,使用hadoop3.2.1测试成功

续上

就这一个路径问题,我尝试了很多次都没有成功,怎么改都不行。

后来,我尝试了使用2.7.7版本的hadoop重新安装,成功了。

在此之前我使用的是最新的3.x版本,可能是因为新版的某些设置一些不一样吧。

在尝试过程中,我发现使用wget从官网直接获取hadoop.x.tar.gz总是失败然后我在宿主机把hadoop-2.7.7.tar.gz复制到共享文件夹。这个时候发现居然在虚拟机中看不到共享文件夹了,这时我已经安装过VMware Tools。我再次执行 sudo vmware-config-tools.pl之后重启解决。



hadoop文档中附带了一些供我们测试的例子,我们可以先运行WordCount的例子来检测一下hadoop是否安装成功。

首先我们在hadoop目录下新建input文件夹cd /usr/local/hadoop;mkdir input

然后将/etc/hadoop下的*.xml文件拷贝至input文件夹中。然后执行代码 ./bin/hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+'



最后输出结果



至此,单机安装结束。

四、Enjoy!

Hadoop安装教程_单机(含Java、ssh安装配置)的更多相关文章

  1. Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0

    Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0 环境 本教程使用 CentOS 6.4 32位 作为系统环境,请自行安装系统.如果用的是 Ubuntu 系统,请查 ...

  2. 转载:Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...

  3. Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    摘自: http://www.cnblogs.com/kinglau/p/3796164.html http://www.powerxing.com/install-hadoop/ 当开始着手实践 H ...

  4. Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04(转)

    http://www.powerxing.com/install-hadoop/ http://blog.csdn.net/beginner_lee/article/details/6429146 h ...

  5. 【转】Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    原文链接:http://dblab.xmu.edu.cn/blog/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单, ...

  6. Hadoop安装教程_单机/伪分布式配置

    环境 本教程使用 CentOS 6.4 32位 作为系统环境,请自行安装系统(可参考使用VirtualBox安装CentOS).如果用的是 Ubuntu 系统,请查看相应的 Ubuntu安装Hadoo ...

  7. 新手推荐:Hadoop安装教程_单机/伪分布式配置_Hadoop-2.7.1/Ubuntu14.04

    下述教程本人在最新版的-jre openjdk-7-jdk OpenJDK 默认的安装位置为: /usr/lib/jvm/java-7-openjdk-amd64 (32位系统则是 /usr/lib/ ...

  8. Hadoop安装教程_伪分布式

    文章更新于:2020-04-09 注1:hadoop 的安装及单机配置参见:Hadoop安装教程_单机(含Java.ssh安装配置) 注2:hadoop 的完全分布式配置参见:Hadoop安装教程_分 ...

  9. [大数据从入门到放弃系列教程]在IDEA的Java项目里,配置并加入Scala,写出并运行scala的hello world

    [大数据从入门到放弃系列教程]在IDEA的Java项目里,配置并加入Scala,写出并运行scala的hello world 原文链接:http://www.cnblogs.com/blog5277/ ...

随机推荐

  1. Spark入门(二)--如何用Idea运行我们的Spark项目

    用Idea搭建我们的Spark环境 用IDEA搭建我们的环境有很多好处,其中最大的好处,就是我们甚至可以在工程当中直接运行.调试我们的代码,在控制台输出我们的结果.或者可以逐行跟踪代码,了解spark ...

  2. .NET Core学习笔记(5)——WebAPI从Server端push消息到Client

    标题起得有点厉害,汉字夹杂着E文,不符合教育部公布的“向社会推荐使用的外语词中文译名”规范.不过他管不着我.写本篇的起因,是重构一个现有的WinForms程序,将Server端的部分逻辑从raw so ...

  3. 给 ABP vNext 应用安装私信模块

    在上一节五分钟完成 ABP vNext 通讯录 App 开发 中,我们用完成了通讯录 App 的基础开发. 这本章节,我们会给通讯录 App 安装私信模块,使不同用户能够通过相互发送消息,并接收新私信 ...

  4. 【简介】OpenOCD 由jtag操作到parport driver流程

    1. 定义 jtag_command_type 在 OpenOCD 中,JTag 命令在枚举 jtag_command_type 中定义,定义如下: /** * The type of the @c ...

  5. snmap弱口令攻击利用

    科普Snmap: 简单网络管理协议(SNMP) 是专门设计用于在 IP 网络管理网络节点(服务器.工作站.路由器.交换机及HUBS等)的一种标准协议,它是一种应用层协议.具体废话就不多说了,自己百度去 ...

  6. python使用pip安装模块出现ReadTimeoutError: HTTPSConnectionPool的解决方法

    今天使用pip安装第三库时,有时会报错: pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='file ...

  7. [源码分析] 从FlatMap用法到Flink的内部实现

    [源码分析] 从FlatMap用法到Flink的内部实现 0x00 摘要 本文将从FlatMap概念和如何使用开始入手,深入到Flink是如何实现FlatMap.希望能让大家对这个概念有更深入的理解. ...

  8. 为何Keras中的CNN是有问题的,如何修复它们?

    在训练了 50 个 epoch 之后,本文作者惊讶地发现模型什么都没学到,于是开始深挖背后的问题,并最终从恺明大神论文中得到的知识解决了问题. 上个星期我做了一些实验,用了在 CIFAR10 数据集上 ...

  9. Spring - 事务管理概述

      什么是事务管理? 第一个问题:什么是事务? 事务一般是相对数据库而言的,对于数据库一次操作就属于一个事务, 一次操作可以是几句 SQL 语句,也可以是若干行 JDBC 的 Java 语句.事务既然 ...

  10. flask中的表单文件上传

    在表单中上传文件时,一定要加入 enctype="multipart/form-data" 属性 为什么要加入这个属性呢: enctype就是encodetype就是编码类型的意思 ...