SingleNode HDFS 搭建过程

背景

1. 纯粹测试

2. 未考虑安全和授权以及数据处理.

3. 单节点最简单的部署, 验证功能连接的可能性

资料获取以及环境变量的设置

获取最新的安装文件

https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz

文件不到600m 大小下载速度还是可以的.
设置环境变量

export PATH=$PATH:/app/server/runtime/java/x86_64-linux/bin/:/hadoop/bin:/hadoop/sbin

export HDFS_DATANODE_USER=root

export HDFS_NAMENODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export JAVA_HOME=/app/server/runtime/java/x86_64-linux/

注意我这边设置的表简单直接放到了/etc/profile.d/app.sh 然后source一下就可以了
可以看到我这边使用了比较简单的 root用户运行.

部署单节点的hdfs

修改设置变量文件

前提条件, 我讲hadoop 整个目录放到了 /hadoop 里面, 跟环境变量呼应.

修改配置文件

cd /hadoop/etc/hadoop/

hdfs-site.xml

内容设置为

# 注意肯恩需要先设置一下file 后面的路径.

# 注意我这边是简单的singleNode 所以replication 设置的是 1.

<configuration>

   <!--指定hdfs保存数据的副本数量-->

    <property>

            <name>dfs.replication</name>

            <value>1</value>

    </property>

    <!--指定hdfs中namenode的存储位置-->

    <property>

             <name>dfs.namenode.name.dir</name>

             <value>file:/data/hadoop/tmp/dfs/name</value>

    </property>

    <!--指定hdfs中datanode的存储位置-->

    <property>

             <name>dfs.datanode.data.dir</name>

             <value>file:/data/hadoop/tmp/dfs/data</value>

    </property>

</configuration>

修改另一个配置文件

 core-site.xml

 <configuration>

   <property>

               <name>fs.defaultFS</name>

               <value>hdfs://someip:8020</value>

   </property>

  <property>

            <name>hadoop.tmp.dir</name>

            <value>file:/data/hadoop/tmp</value>

   </property>

       <name>fs.checkpoint.period</name>

       <value>3600</value>

</configuration>

# 注意需要记住ip地址.

进行初始化

直接使用官网介绍的命令就可以

Format the filesystem:

  $ bin/hdfs namenode -format

Start NameNode daemon and DataNode daemon:

  $ sbin/start-dfs.sh

The hadoop daemon log output is written to the $HADOOP_LOG_DIR directory (defaults to $HADOOP_HOME/logs).

Browse the web interface for the NameNode; by default it is available at:

NameNode - http://localhost:9870/

Make the HDFS directories required to execute MapReduce jobs:

  $ bin/hdfs dfs -mkdir /user

  $ bin/hdfs dfs -mkdir /user/<username>

Copy the input files into the distributed filesystem:

  $ bin/hdfs dfs -mkdir input

  $ bin/hdfs dfs -put etc/hadoop/*.xml input

Run some of the examples provided:

  $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar grep input output 'dfs[a-z.]+'

Examine the output files: Copy the output files from the distributed filesystem to the local filesystem and examine them:

  $ bin/hdfs dfs -get output output

  $ cat output/*

or

View the output files on the distributed filesystem:

  $ bin/hdfs dfs -cat output/*

When you’re done, stop the daemons with:

  $ sbin/stop-dfs.sh

检查一下部署结果

打开网页 http://nodeip:9870
展示Node节点的情况的结果
展示文件系统, 这里我没考虑权限好像控制台权限是没法进行upload和delete的改天学习下 , 另外不清楚 8020端口的安全设置
展示具体的文件夹内的内容

SingleNode HDFS 搭建过程的更多相关文章

懒人记录 Hadoop2.7.1 集群搭建过程
懒人记录 Hadoop2.7.1 集群搭建过程 2016-07-02 13:15:45 总结除了配置hosts ,和免密码互连之外,先在一台机器上装好所有东西配置好之后,拷贝虚拟机,配置hosts ...
Hadoop完全分布式搭建过程中遇到的问题小结
前一段时间,终于抽出了点时间,在自己本地机器上尝试搭建完全分布式Hadoop集群环境,也是借助网络上虾皮的Hadoop开发指南系列书籍一步步搭建起来的,在这里仅代表hadoop初学者向虾皮表示衷心的感 ...
Hadoop集群(二) HDFS搭建
HDFS只是Hadoop最基本的一个服务,很多其他服务,都是基于HDFS展开的.所以部署一个HDFS集群,是很核心的一个动作,也是大数据平台的开始. 安装Hadoop集群,首先需要有Zookeeper ...
【安装】Hadoop2.8.0搭建过程整理版
Hadoop搭建过程前期环境搭建主要分为软件的安装与配置文件的配置,集成的东西越多,配置项也就越复杂. Hadoop集成了一个动物园,所以配置项也比较多,且每个版本之间会有少许差异. 安装的方式有很 ...
本地+分布式Hadoop完整搭建过程
1 概述 Hadoop在大数据技术体系中极为重要,被誉为是改变世界的7个Java项目之一(剩下6个是Junit.Eclipse.Spring.Solr.HudsonAndJenkins.Android ...
Maven多模块，Dubbo分布式服务框架，SpringMVC，前后端分离项目，基础搭建，搭建过程出现的问题
现互联网公司后端架构常用到Spring+SpringMVC+MyBatis,通过Maven来构建.通过学习,我已经掌握了基本的搭建过程,写下基础文章为而后的深入学习奠定基础. 首先说一下这篇文章的主要 ...
Access应用笔记<四>-一个完整的自动化报表搭建过程
距离之前的三篇日志已经很久啦,今天终于完成了一个比较完整的自动化报表搭建过程基于公司数据保密原则,样板就不放到网上来了,简单说一下背景: 这次access实现的功能包括: 1)为部门整体搭建了一个员 ...
iOS---XMPP环境搭建过程
什么是即时通信? 即时通信是目前Internet上最为流行的通讯方式, 各种各样的即时通讯软件也层出不穷, 服务提供商也提供了越来越枫木的通讯服务功能. 即时通讯有多重实现方式, XMPP就是其中一种 ...
最简单的SVN环境搭建过程
本文简单描述最简单的SVN环境搭建过程搭建环境:windows (个人验证了windows2003,windows xp) 使用软件:Setup-Subversion-1.6.17 //Serve ...
cocos2d-x3.9 NDK android 环境搭建过程中遇到的错误
编译环境:Mac OS, NDK r9d 错误:arm-linux-androideabi-gcc: error trying to exec '/media/Project/adt-bundle-l ...

随机推荐

搞AI开发，你不得不会的PyCharm技术
摘要:PyCharm在AI项目开发提供了优秀的代码编辑.调试.远程连接和同步能力,在开发者中广受欢迎. 使用PyCharm插件配合ModelArts: 一键帮助用户配置远程ModelArts Note ...
实践GoF的设计模式：访问者模式
摘要:访问者模式的目的是,解耦数据结构和算法,使得系统能够在不改变现有代码结构的基础上,为对象新增一种新的操作. 本文分享自华为云社区<[Go实现]实践GoF的23种设计模式:访问者模式> ...
vue2升级vue3：getCurrentInstance—Composition api/hooks中如何获取$el
在vue2中,我们进程看到 this.$el 操作.但是在vue3 如何获取组件的当前 dom 元素呢? 可以利用 getCurrentInstance getCurrentInstance Vue ...
html5鼠标拖动排序及resize实现方案分析及实践
对列表进行拖动排序,尺寸改变.之前一般会使用jQuery-UI.其通过mousedown.mousemove.mouseup这三个事件来实现页面元素被鼠标拖拽的效果.vue-drag-resize v ...
Solon 1.6.29 发布，轻量级应用开发框架
关于官网千呼万唤始出来: https://solon.noear.org .整了一个月多了...还得不断接着整! 关于 Solon Solon 是一个轻量级应用开发框架.支持 Web.Data.Jo ...
JAVA 获取 URL 指定参数的值
JAVA 获取 URL 指定参数的值 @Test void regexTest() { String url = "https://www.cnblogs.com/vipsoft/p/152 ...
机器学习的线性代数（Python 版）
线性代数是数学的分支学科,涉及矢量.矩阵和线性变换.它是机器学习的重要基础,从描述算法操作的符号到代码中算法的实现,都属于该学科的研究范围. 虽然线性代数是机器学习领域不可或缺的一部分,但二者的紧密关 ...
AtCoder Beginner Contest 242（C~E）
AB 水题 C - 1111gal password 题意:给出 N($2\le N\le 1e6$)求满足以下条件的 $X$ 的数量,需除以模 ($998244353$) $X $ 是 ...
springboot项目pom文件设置<profile>读取不同的配置文件（网上瞎copy的大把，测试过真实可用）
这篇文章主要介绍关于springboot如何通过多个properties实现数据库环境部署时自动切换配置的两种方式,部署时切换方式和打包时Maven控制方式.
SpringCloud学习系列十、服务熔断与降级（1-简介）
系列导航 SpringCloud学习系列一. 前言-为什么要学习微服务 SpringCloud学习系列二. 简介 SpringCloud学习系列三. 创建一个没有使用springCloud的服务 ...

SingleNode HDFS 搭建过程

背景

资料获取以及环境变量的设置

部署单节点的hdfs

检查一下部署结果

SingleNode HDFS 搭建过程的更多相关文章

随机推荐

热门专题