ubuntu 18.04.1安装hadoop3.1.2

前提，虚拟机安装　见https://www.cnblogs.com/cxl-blog/p/11363183.html

一．按照https://blog.csdn.net/MastetHuang/article/details/51867115该步骤进行

其中有以下几个小问题

1.注意上述链接中的hadoop-2.6.4需要修改为自己的hadoop版本，同时，hdfs-site.xml和core-site.xml等配置文件的修改中的hadoop-2.6.4也应一并修改

2.配置文件还需作如下修改

vim /hadoop-3.1.2/etc/hadoop/core-site.xml

添加如下：

<configuration>

    <property>

        <name>fs.defaultFS</name>
　　　　　<value>hdfs://localhost:9000 </value>
　　</property> 
　　<property> 　　
 　　　　<name>hadoop.tmp.dir</name>
　　　　　<value>/data/hadoop/tmp </value>
　　</property>

　　<property> 
        <name>hadoop.native.lib</name>
　　　　　<value>true</value>　　
　　</property> 
<configuration>

vim /data/hadoop/etc/hadoop/hdfs-site.xml

添加如下：

<configuration>

    <property>

        <name>dfs.replication</name>

        <value></value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>/data/hadoop/hdfs/name</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>/data/hadoop/hdfs/data</value>

    </property>

    <property>

        <name>dfs.permissions</name>

        <value>false</value>

    </property>

</configuration>

vim /data/hadoop/etc/hadoop/mapred-site.xml

添加如下：

<configuration>

    <property>

    <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

vim /data/hadoop/etc/hadoop/yarn-site.xml

添加如下：

<configuration>

<property>

    <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>  ##注意这里有坑  mapreduce.shuffle 链接符为.的时候有问题

    </property>

</configuration>

3.修改JAVA_HOME 时记得把＃去掉

export JAVA_HOME=/usr/local/jdk1..0_79

4.拷贝主机文件（hadoop）到虚拟机　在虚拟机中执行

scp 192.168.0.119:/home/cxl/Downloads/hadoop-3.1..tar.gz /home/cxl/ hadoop-3.1.

其中　192.168.0.119为本机IP ,/home/hostname/为自己的路径

5.编辑profile文件一旦没有写正确，导致在命令行下 ls等命令不能够识别

在命令行下打入下面这段

export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

6.主机无法ssh连接虚拟机，也ping不通

见https://blog.csdn.net/chengqiuming/article/details/83239413　设置好后在主机中执行

ssh 127.0.0.1 -p

设置端口转发后主机监听本地2022端口，如果ssh -p 2022,就将ssh到虚拟机，所以是ssh 127.0.0.1

二.安装完后

1.创建文件夹（配置文件core-site.xml中hadoop.tmp.dir　设置的就是tmp）

cd /data/hadoop

mkdir tmp

cd tmp

mkdir name data

chmod -R  tmp

2.格式化

cd /hadoop-3.1.2/bin

hdfs namenode -format

3.启动hadoop

cd hadoop-3.1.2/sbin/

./start-all.sh

4.操作hdfs

确保在hadoop的bin目录下

cd /hadoop3.1.2/bin

hdfs dfs -mkdir /test

或

hadoop fs -mkdir /test

其他简单操作见https://blog.csdn.net/MESSI_JAMES/article/details/81174908

详情见官方文档http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html

后续：

1.datanode启动后自动关闭

解决方法：https://blog.csdn.net/a469142780/article/details/71312143

问题：Namenode上namespaceID与datanode上namespaceID不一致。
　　问题产生原因：每次namenode format会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有清空datanode下的数据,所以造成namenode节点上的namespaceID与datanode节点上的namespaceID不一致。启动失败。
解决方法：
　　(1)停掉集群服务
　　(2)在出问题的datanode节点上删除data目录，data目录即是在hdfs-site.xml文件中配置的dfs.data.dir目录，本机器上那个是/hadoop/hadoop-2.7.1/hdfs/dfs/data/ (注：在所有的datanode和namenode节点上均执行了该步骤。以防删掉后不成功，可以先把data目录复制一份)。
　　(3)格式化namenode.
　　(4)重新启动集群。
　　问题解决。
谨记：这种方法带来的一个副作用就是会造成hdfs上的所有数据丢失。

ubuntu 18.04.1安装hadoop3.1.2的更多相关文章

如何在Ubuntu 18.04中安装VMware Workstation Player
参考链接如何在Ubuntu 18.04中安装VMware Workstation Player https://www.sysgeek.cn/ubuntu-18-04-install-vmware- ...
如何在Ubuntu 18.04上安装Pip
一.简介: Pip是一个软件包管理系统,它简化了用Python编写的软件包(如Python包索引(PyPI)中的软件包)的安装和管理. 在Ubuntu 18.04上缺省没有安装Pip,但安装非常简单. ...
如何在Ubuntu 18.04上安装Django
Django是一个免费的开源高级Python Web框架,旨在帮助开发人员构建安全,可扩展和可维护的Web应用程序. 根据您的需要,有不同的方法来安装Django.它可以使用pip在系统范围内安装或在 ...
如何在Ubuntu 18.04上安装和配置Apache 2 Web服务器(转)
如何在Ubuntu 18.04上安装和配置Apache 2 Web服务器什么是Apache Web Server? Apache或Apache HTTP服务器是一个免费的开源Web服务器,由Apac ...
转：ubuntu 18.04 LTS 安装 java10（JDK）及问题说明
原文地址:ubuntu 18.04 LTS 安装 java10 及问题说明 1.下载相应的安装包,例如jdk-10.0.1_linux-x64_bin.tar.gz.下载地址: http://www. ...
在Ubuntu 18.04上安装Tensorflow
我们将经历几个阶段,安装cuda-9.0,cudnn和tensorflow cpu以及tensorflow gpu版本.最后我们将用cuda-9.0安装pytorch.在MARVEl电影中黑寡妇的“我 ...
如何在Ubuntu 18.04上安装Go
如何在Ubuntu 18.04上安装Go 谢鸢发表于云计算教程系列订阅98 介绍课程准备第1步 - 安装Go 第2步 - 设置Go路径第3步 - 测试您的安装结论介绍 Go是Google开发 ...
Ubuntu 18.04上安装 phpMyAdmin
我们将安装 phpMyAdmin 在 Ubuntu18.04 上配合 Apache 一起工作. 在安装 phpMyAdmin 之前需要已经安装了LAMP栈并提供了web页面. 如果没有安装可以参照 U ...
Ubuntu 18.04上安装Apache, MySQL, PHP, LAMP
1.安装 Apache $ sudo apt update && sudo apt install apache2 中间会遇到停顿询问是否继续, 输入 y 然后回车. 2.测试 Ap ...

随机推荐

gulp 批量添加类名在一个任务中使用多个文件来源
1.首先安装环境 1.安装gulp: npm install gulp 2.安装gulp-clean-css npm install gulp-clean-css 3.安装gulp-css-wrap ...
css隐藏滚动条、移动端滚动卡顿的解决
1.如果想保持容器能够滚动,同时不想看到丑陋的滚动条,chrome.firefox和移动端上不考虑兼容性直接 element::-webkit-scrollbar{ display:none } 2. ...
C# dotnet 获取整个局域网的 ip 地址
局域网可以使用的 IP 地址有很多,我写了一段代码用来枚举所有可以用的 ip 地址小伙伴都知道,局域网可以使用的 IP 范围如下 A类地址:10.0.0.0 - 10.255.255.255 B类地 ...
WPF TreeView 展开到指定节点
最近在做一个交换机管理的项目,有一个交换机的树,做树的搜索的时候展开节点居然有点难,自己记录下来 ,以后用的到的时候可以看一下. 展开代码如下,其中 SwitchTree是treeview空间的名称 ...
Mybase desktop7.3破解
1.Mybase Desktop 7.3 安装包百度云链接: 链接:https://pan.baidu.com/s/1mWZ2_Qmkf6aAX9CYgrN12A 提取码:vjw7 2.破解包百度 ...
深入JVM（二）JVM概述
深入JVM(一)JVM指令手册深入JVM(二)JVM概述一.JVM的原理 Java虚拟机是Java平台的基石,解决了硬件和操作系统的相互独立性.不同平台(Windows,Linux和MacOS)的 ...
解析GMT+N时区，返回日期类型
涉及到正则表达式,时区转换. /** * * 按格式 yyyy-MM-dd HH:mm:ss 以指定GMT时区进行解析,返回对应的当前系统时区当地时间. * @param dateString 格式 ...
Python学习（二）语言基础
一.变量与类型在程序设计中,变量是一种存储数据的载体整型:Python中可以处理任意大小的整数浮点型:浮点数也就是小数字符串型:字符串是以单引号或双引号括起来的任意文本布尔型:布尔值只有Tr ...
网络状态诊断工具——netstat命令
netstat命令可以用来查询整个系统的网络状态.百度百科的定义如下: Netstat的定义是: Netstat是在内核中访问网络连接状态及其相关信息的程序,它能提供TCP连接,TCP和UDP监听,进 ...
「洛谷P3931」 SAC E#1 - 一道难题 Tree
P3931 SAC E#1 - 一道难题 Tree 题目背景冴月麟和魏潇承是好朋友. 题目描述冴月麟为了守护幻想乡,而制造了幻想乡的倒影,将真实的幻想乡封印了.任何人都无法进入真实的幻想乡了,但是 ...

ubuntu 18.04.1安装hadoop3.1.2

ubuntu 18.04.1安装hadoop3.1.2的更多相关文章

随机推荐

热门专题