前提,虚拟机安装 见https://www.cnblogs.com/cxl-blog/p/11363183.html

一.按照https://blog.csdn.net/MastetHuang/article/details/51867115该步骤进行

其中有以下几个小问题

1.注意上述链接中的hadoop-2.6.4需要修改为自己的hadoop版本,同时,hdfs-site.xml和core-site.xml等配置文件的修改中的hadoop-2.6.4也应一并修改

2.配置文件还需作如下修改

vim /hadoop-3.1.2/etc/hadoop/core-site.xml
添加如下:
<configuration>
<property>
<name>fs.defaultFS</name>
     <value>hdfs://localhost:9000 </value>
  </property>
  <property>   
    <name>hadoop.tmp.dir</name>
     <value>/data/hadoop/tmp </value>
  </property>
  <property> 
<name>hadoop.native.lib</name>
     <value>true</value>  
  </property>
<configuration>
vim /data/hadoop/etc/hadoop/hdfs-site.xml 
添加如下:
<configuration>
<property>
<name>dfs.replication</name>
<value></value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/data/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/data/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
vim /data/hadoop/etc/hadoop/mapred-site.xml 
添加如下:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
vim /data/hadoop/etc/hadoop/yarn-site.xml 
添加如下:
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value> ##注意这里有坑 mapreduce.shuffle 链接符为.的时候有问题
</property>
</configuration>
3.修改JAVA_HOME 时记得把#去掉
export JAVA_HOME=/usr/local/jdk1..0_79

4.拷贝主机文件(hadoop)到虚拟机  在虚拟机中执行

scp 192.168.0.119:/home/cxl/Downloads/hadoop-3.1..tar.gz /home/cxl/ hadoop-3.1.

其中 192.168.0.119为本机IP ,/home/hostname/为自己的路径

5.编辑profile文件一旦没有写正确,导致在命令行下 ls等命令不能够识别

在命令行下打入下面这段

export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

6.主机无法ssh连接虚拟机,也ping不通

https://blog.csdn.net/chengqiuming/article/details/83239413 设置好后在主机中执行

ssh 127.0.0.1 -p 

设置端口转发后主机监听本地2022端口,如果ssh -p 2022,就将ssh到虚拟机,所以是ssh 127.0.0.1

二.安装完后

1.创建文件夹(配置文件core-site.xml中hadoop.tmp.dir 设置的就是tmp

cd /data/hadoop
mkdir tmp
cd tmp
mkdir name data
chmod -R tmp

2.格式化

cd /hadoop-3.1.2/bin
hdfs namenode -format

3.启动hadoop

cd hadoop-3.1.2/sbin/
./start-all.sh

4.操作hdfs

确保在hadoop的bin目录下

cd /hadoop3.1.2/bin
hdfs dfs -mkdir /test

hadoop fs -mkdir /test

其他简单操作见https://blog.csdn.net/MESSI_JAMES/article/details/81174908

详情见官方文档http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html

后续:

1.datanode启动后自动关闭

解决方法:https://blog.csdn.net/a469142780/article/details/71312143

问题:Namenode上namespaceID与datanode上namespaceID不一致。
  问题产生原因:每次namenode format会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有清空datanode下的数据,所以造成namenode节点上的namespaceID与datanode节点上的namespaceID不一致。启动失败。
解决方法:
  (1)停掉集群服务
  (2)在出问题的datanode节点上删除data目录,data目录即是在hdfs-site.xml文件中配置的dfs.data.dir目录,本机器上那个是/hadoop/hadoop-2.7.1/hdfs/dfs/data/ (注:在所有的datanode和namenode节点上均执行了该步骤。以防删掉后不成功,可以先把data目录复制一份)。
  (3)格式化namenode.
  (4)重新启动集群。
  问题解决。
谨记:这种方法带来的一个副作用就是会造成hdfs上的所有数据丢失。

ubuntu 18.04.1安装hadoop3.1.2的更多相关文章

  1. 如何在Ubuntu 18.04中安装VMware Workstation Player

    参考链接 如何在Ubuntu 18.04中安装VMware Workstation Player https://www.sysgeek.cn/ubuntu-18-04-install-vmware- ...

  2. 如何在Ubuntu 18.04上安装Pip

    一.简介: Pip是一个软件包管理系统,它简化了用Python编写的软件包(如Python包索引(PyPI)中的软件包)的安装和管理. 在Ubuntu 18.04上缺省没有安装Pip,但安装非常简单. ...

  3. 如何在Ubuntu 18.04上安装Django

    Django是一个免费的开源高级Python Web框架,旨在帮助开发人员构建安全,可扩展和可维护的Web应用程序. 根据您的需要,有不同的方法来安装Django.它可以使用pip在系统范围内安装或在 ...

  4. 如何在Ubuntu 18.04上安装和配置Apache 2 Web服务器(转)

    如何在Ubuntu 18.04上安装和配置Apache 2 Web服务器 什么是Apache Web Server? Apache或Apache HTTP服务器是一个免费的开源Web服务器,由Apac ...

  5. 转:ubuntu 18.04 LTS 安装 java10(JDK) 及问题说明

    原文地址:ubuntu 18.04 LTS 安装 java10 及问题说明 1.下载相应的安装包,例如jdk-10.0.1_linux-x64_bin.tar.gz.下载地址: http://www. ...

  6. 在Ubuntu 18.04上安装Tensorflow

    我们将经历几个阶段,安装cuda-9.0,cudnn和tensorflow cpu以及tensorflow gpu版本.最后我们将用cuda-9.0安装pytorch.在MARVEl电影中黑寡妇的“我 ...

  7. 如何在Ubuntu 18.04上安装Go

    如何在Ubuntu 18.04上安装Go 谢鸢发表于云计算教程系列订阅98 介绍 课程准备 第1步 - 安装Go 第2步 - 设置Go路径 第3步 - 测试您的安装 结论 介绍 Go是Google开发 ...

  8. Ubuntu 18.04上安装 phpMyAdmin

    我们将安装 phpMyAdmin 在 Ubuntu18.04 上配合 Apache 一起工作. 在安装 phpMyAdmin 之前需要已经安装了LAMP栈并提供了web页面. 如果没有安装可以参照 U ...

  9. Ubuntu 18.04上安装Apache, MySQL, PHP, LAMP

    1.安装 Apache $ sudo apt update && sudo apt install apache2 中间会遇到停顿询问是否继续, 输入 y 然后 回车. 2.测试 Ap ...

随机推荐

  1. 理解Servlet

    题记:框架横行,似乎已经忘记JavaWeb最基础Servlet是如何工作的,这也是为什么要写这篇文章. Servlet是Java语言应用到Web的扩展技术,是运行在Web应用服务器上的Java程序.与 ...

  2. 一个简单的Web服务器-支持Servlet请求

    上接 一个简单的Web服务器-支持静态资源请求,这个服务器可以处理静态资源的请求,那么如何处理Servlet请求的呢? 判断是否是Servlet请求 首先Web服务器需要判断当前请求是否是Servle ...

  3. spring boot 多数据源加载原理

    git代码:https://gitee.com/wwj912790488/multiple-data-sources DynamicDataSourceAspect切面 必须定义@Order(-10) ...

  4. C++的特殊预处理定义#、##和#@

    c/c++的预处理定义: 一.Stringizing Operator (#) 在c和c++中数字标志符#被赋予了新的意义,即字符串化操作符.其作用是:将宏定义中的传入参数名转换成用一对双引号括起来的 ...

  5. kubernetes实战(三十):CentOS 8 二进制 高可用 安装 k8s 1.17.x

    1. 基本说明 本文章将演示CentOS 8二进制方式安装高可用k8s 1.17.x,相对于其他版本,二进制安装方式并无太大区别. 2. 基本环境配置 主机信息 192.168.1.19 k8s-ma ...

  6. 公子奇带你一步一步了解Java8中行为参数化

    说明:因为本公子一直从事监狱软件开发,所以本系列博客的引入也以此为背景.问题做了简化,只是为了来讲解技术点. 一.问题提出 今日在好好的撸着代码,超哥(民警)找来了,让把监狱30岁以上的民警找给他. ...

  7. 【游记】THUWC2019-2 Bystander

    [游记]THUWC2019-2 Bystander Day0/-1 感觉自己怎么样都去不了PKUWC(没错)了,差点放弃模拟面试,在老妈的要求下勉强面试,自我介绍没怎么准备,然后就说 我喜欢唱跳Rap ...

  8. CentOS防火墙iptables使用

    1.1 企业安全优化配置原则 尽可能不给服务器配置外网ip ,可以通过代理转发或者通过防火墙映射.并发不是特别大情况有外网ip,可以开启防火墙服务高并发的情况,不能开iptables,会影响性能,利用 ...

  9. 端口扫描器--利用python的nmap模块

    安装nmap模块挺麻烦的,搞了半天 不仅要安装pip install nmap 还要sudo apt install nmap 给出代码,没有设多线程,有点慢,注意端口的类型转换,搞了很久 #!/us ...

  10. 【转】C#虚方法virtual详解

    转:https://www.cnblogs.com/zhaoshujie/p/10502404.html 在C++.Java等众多OOP语言里都可以看到virtual的身影,而C#作为一个完全面向对象 ...