Hadoop安装-伪分布式-Pseudo

〇、所需资料

一、前置环境安装

1、包含内容

（1）安装

虚拟机安装、系统安装

（2）配置

ip、host、主机名配置

关闭防火墙及selinux

SSH免密登录

（2）基础环境安装

安装jdk

安装ntpd开启时钟同步

2、参考地址

https://www.cnblogs.com/liujinhui/p/16838546.html

二、Hadoop安装配置

1、解压与环境变量配置

（1）目录介绍

sbin目录：服务的启动脚本

bin目录：功能模块下的一些命令

lib：所需jar包

（2）环境变量配置

vi /etc/profile

增加：hadoop的bin和sbin目录

source /etc/profile使配置文件生效

2、hadoop-env.sh：配置jdk

export JAVA_HOME=/usr/java/default

3、core-site.xml：配置NN

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://hadoop01:9000</value>

    </property>

		<property>

				<name>hadoop.tmp.dir</name>

				<value>/usr/local/data/hadoop</value>

		</property>

</configuration>

4、hdfs-site.xml：配置SNN和DN

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

		<property>

		    <name>dfs.namenode.name.dir</name>

		    <value>/usr/local/data/hadoop/dfs/name</value>

		</property>

		<property>

		    <name>dfs.datanode.data.dir</name>

		    <value>/usr/local/data/hadoop/dfs/data</value>

		</property>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

		<property>

		      <name>dfs.namenode.secondary.http-address</name>

		      <value>hadoop01:50090</value>

		</property>

		<property>

		      <name>dfs.namenode.checkpoint.dir</name>

		      <value>/var/bigdata/hadoop/local/dfs/secondary</value>

		</property>

</configuration>

5、slaves：配置DN节点位置

hadoop01

三、启动及验证

1、格式化NN

bin/hdfs namenode -format

2、验证NN对应位置

/usr/local/data/hadoop/dfs/name/xxx

3、HDFS启动与验证

sbin/start-dfs.sh

4、页面及生成文件验证

（1）页面验证

修改Windows的地址：C:\Windows\System32/drivers\etc\hosts

增加ip和主机的映射关系

192.168.40.101 hadoop01

四、使用

1、命令介绍

hdfs dfs【得到支持的命令】

2、创建目录

创建目录：hdfs dfs -mkdir abc（操作的是NN的元数据）

通常会创建：hdfs dfs -mkdir -p /usr/root 【点右上角的go!进行刷新】【对比linux家目录home，此处为user】【-p表示递归创建】

3、上传文件

上传数据：hdfs dfs -put a.txt /usr/root【点go刷新】

上传过程显示：COPYING

4、查看DN文件所在位置

/usr/local/data/hadoop/dfs/data/xxx

5、上传时附加配置

按字节切割：block.size【hdfs-site.xml】

上传时，指定块大小1m，验证如何切割

hdfs dfs -D dfs.blocksize=1024*1024(1048576=1m) -put data.txt

【实战】Hadoop安装01-伪分布式-Pseudo的更多相关文章

ubantu18.04下Hadoop安装与伪分布式配置
1 下载下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/stable2/ 2 解压将文件解压到 /usr/local/hadoop cd ~ ...
Hadoop安装-单机-伪分布式简单部署配置
最近在搞大数据项目支持所以有时间写下hadoop随笔吧. 环境介绍: Linux: centos7 jdk:java version "1.8.0_181 hadoop:hadoop-3.2 ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop
一．实验目的 1. 掌握Linux虚拟机的安装方法. 2. 掌握Hadoop的伪分布式安装方法. 二．实验内容 (一)Linux基本操作命令 Linux常用基本命令包括: ls,cd,mkdir,rm ...
java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式大数据概念大数据概论大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
VMwareWorkstation 平台 Ubuntu14 下安装配置伪分布式 hadoop
VMwareWorkstation平台Ubuntu14下安装配置伪分布式hadoop 安装VmwareStation 内含注册机. 链接:https://pan.baidu.com/s/1j-vKgD ...
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode)
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载相应的jdk和Hadoop安装包 JDK:h ...
使用Docker搭建Hadoop集群(伪分布式与完全分布式)
之前用虚拟机搭建Hadoop集群(包括伪分布式和完全分布式:Hadoop之伪分布式安装),但是这样太消耗资源了,自学了Docker也来操练一把,用Docker来构建Hadoop集群,这里搭建的Hado ...
Hadoop学习2—伪分布式环境搭建
一.准备虚拟环境 1. 虚拟环境网络设置 A.安装VMware软件并安装linux环境,本人安装的是CentOS B.安装好虚拟机后,打开网络和共享中心 -> 更改适配器设置 -> 右键V ...
centos中-hadoop单机安装及伪分布式运行实例
创建用户并加入授权 1,创建hadoop用户 sudo useradd -m hadoop -s /bin/bash 2,修改sudo的配置文件,位于/etc/sudoers,需要root权限才可以读 ...

随机推荐

关于使用kubeoperator搭建k8s集群使用containerd作为容器运行时，从自己搭建的habor仓库拉取镜像的有关说明
1.kubepi界面添加habor仓库信息,并授权给k8s集群这一步的操作是当在工作负载选择从harbor仓库拉取镜像时会自动创建有关的secrets信息,从而不用事先手动创建了(有别于kuboar ...
Kubernetes 控制器
在实际使用的时候并不会直接使用 Pod,而是会使用各种控制器来满足我们的需求,Kubernetes 中运行了一系列控制器来确保集群的当前状态与期望状态保持一致,它们就是 Kubernetes 的大脑. ...
fastdfs-zyc管理FastDFS的web界面
俩压缩包根据大小重命名以下,按图片所示把1_fastdfs-zyc.7z重命名为fastdfs-zyc.7z.001 把2_fastdfs-zyc.7z重命名为fastdfs-zyc.7z.002 ...
19. Fluentd输入插件：in_http用法详解
in_http插件允许使用HTTP协议来采集日志事件.这个插件会建立一个支持REST风格的HTTP端点,来接收日志事件请求. 配置示例 <source> @type http port 9 ...
VideoPipe可视化视频结构化框架开源了！
完成多路视频并行接入.解码.多级推理.结构化数据分析.上报.编码推流等过程,插件式/pipe式编程风格,功能上类似英伟达的deepstream和华为的mxvision,但底层核心不依赖复杂难懂的gst ...
mac通过docker一键部署Nexus3
目录 mac通过docker一键部署Nexus3 一.前言二.系统配置三.安装步骤 1.Dockerhub查看镜像地址 2.一键安装 2.1.克隆脚本 2.2.安装程序 2.2.1.程序安装详情 ...
C++ 高级数据类型（六）—— 自定义数据类型
转载:https://blog.csdn.net/zjy900507/article/details/79623829 定义自己的数据类型 (typedef) C++ 允许我们在现有数据类型的基础上定 ...
规则引擎深度对比，LiteFlow vs Drools！
前言 Drools是一款老牌的java规则引擎框架,早在十几年前,我刚工作的时候,曾在一家第三方支付企业工作.在核心的支付路由层面我记得就是用Drools来做的. 难能可贵的是,Drools这个项目在 ...
在vue项目中禁用eslint
文章目录 1.在创建项目的时候不自动使用eslint 2.在package.json中删除所有的eslint,然后重新install 3.按照图片注释(亲测可用) 在使用eslin进行规则验证时,一点 ...
git 多个commit 如何合并
git 多个commit 如何合并本篇主要介绍一下 git 中多个commit 如何合并, 因为commit 太多会导致提交记录混乱, 所以有时候会把多个commit 合并成一个保持提交记录干净 ...

【实战】Hadoop安装01-伪分布式-Pseudo