Hadoop 部署

hadoop部署步骤：

环境rhel8.2

1.配置主机网络信息

使物理机能和主机ping通

使用secureCRT与虚拟连接

设置网卡(dhcp)

[root@maoqiyang ~]# nmcli device connect ens160

Device 'ens160' successfully activated with '4a5b3266-42ad-4e0f-a17d-8f200cc67def'.

2.设置主机名，绑定主机名与ip地址

[root@maoqiyang ~]# hostnamectl set-hostname maoqiyang

[root@maoqiyang ~]# bash

[root@maoqiyang ~]# cat /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

172.16.0.99    maoqiyang

[root@maoqiyang ~]# ping maoqiyang

PING maoqiyang (172.16.0.99) 56(84) bytes of data.

64 bytes from maoqiyang (172.16.0.99): icmp_seq=1 ttl=64 time=0.062 ms

^C

3.开启sshd。关闭防火墙与selinux

systemctl  enable  --now sshd

systemctl  stop   firewalld

systemctl  disable  firewalld

sed  -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config

setenforce 0

4.创建hadoop并设置密码

[root@maoqiyang ~]# useradd hadoop && echo '123' | passwd --stdin hadoop

Changing password for user hadoop.

passwd: all authentication tokens updated successfully.

[root@maoqiyang ~]# cat /etc/shadow | grep hadoop

hadoop:$6$iQ9ZfF0I9gIglEZm$YLyxw22TvWnt63or457hOPBEkY6fCoBnEVpOcT7PcY2XDY3YhzBItoe23ecS5mpKID7x2iqpSbSv/r9s638Kn1:19062:0:99999:7:::

给hadoop提权

vi /etc/sudoers

hadoop  maoqiyang=(root)   NOPASSWD:ALL

5.安装java环境

1.卸载老版本，安装新版

rpm  -qa | grep  java

rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.131-11.b12.el7.x86_64

rpm -e --nodeps java-1.8.0-openjdk-1.8.0.131-11.b12.el7.x86_64

rpm -e --nodeps java-1.7.0-openjdk-headless-1.7.0.141-2.6.10.5.el7.x86_64

rpm -e --nodeps java-1.7.0-openjdk-1.7.0.141-2.6.10.5.el7.x86_64

查看删除结果再次键入命令 java -version

NO such  file or directory则成功

2.传文件

（hadoop一会用）

物理机cmd scp

scp jdk-8u152-linux-x64.tar.gz  root@172.16.0.99:/root

scp hadoop-2.7.1.tar.gz  root@172.16.0.99:/root

3.解压文件

tar -zxvf  jdk-8u152-linux-x64.tar.gz -C /usr/local/src

4.配置jdk环境变量

vi /etc/profile

export JAVA_HOME=/usr/local/src/jdk1.8.0_152

export PATH=$PATH:$JAVA_HOME/bin

source /etc/profile

java -version

6.安装Hadoop软件

tar  -zxvf  ~/hadoop-2.7.1.tar.gz -C  /usr/local/src/

配置环境变量

vi /etc/profile

export HADOOP_HOME=/usr/local/src/hadoop-2.7.1

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source  /etc/profile

hadoop     #查看是否生效

修改目录的所有者和拥有组让hadoop执行的时候不会有权限问题

chown -R hadoop:hadoop /usr/local/src

ll  /usr/local/src

7.安装单机版的hadoop系统

进入hadoop安装的目录

cd /usr/local/src/hadoop-2.7.1/

告诉hadoop系统jdk的目录

vi etc/hadoop/hadoop-env.sh

更改export JAVA_HOME 这行

export JAVA_HOME=/usr/local/src/jdk1.8.0_152

到此设置好了hadoop本地模式

8.运行hadoop

使用hadoop用户来运行hadoop

su - hadoop

将输入的文件放在hadoop家目录的input下

mkdir  ~/input

创建输入文件

vi  ~/input/data.txt

输入内容

Hello World

Hello Hadoop

Hello Huasan

测试mapreduce运行

hadoop jar /usr/local/src/hadoop-2.7.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar  wordcount  ~/input/data.txt  ~/output

hadoop命令 jar包要做什么（wordcount统计单词数量）被统计的输入文件和被统计的输出文件

注意：输出目录不能事先创建，如果已经有~/output 目录，就要选择另外的

输出目录，或者将~/output 目录先删除。删除命令如下所示。

[hadoop@maoqiyang ~]$ rm -rf ~/output

统计多个输入的单词数

hadoop jar /usr/local/src/hadoop-2.7.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar  wordcount  ~/input/data.txt  ~/input/abc ~/input/etc/*  ~/output

~/input/data.txt    ~/input/abc   ~/input/etc/*  都会整合到输出文件output里面

Hadoop 部署的更多相关文章

hadoop部署小结的命令
hadoop部署总结的命令学习笔记,转自:hadoop部署总结的命令http://www.aboutyun.com/thread-5385-1-1.html(出处: about云开发)
Hadoop 部署文档
Hadoop 部署文档 1 先决条件 2 下载二进制文件 3 修改配置文件 3.1 core-site.xml 3.2 hdfs-site.xml 3.3 mapred-site.xml 3.4 ya ...
hadoop进阶----hadoop经验(一)-----生产环境hadoop部署在超大内存服务器的虚拟机集群上vs几个内存较小的物理机
生产环境 hadoop部署在超大内存服务器的虚拟机集群上好还是几个内存较小的物理机上好? 虚拟机集群优点虚拟化会带来一些其他方面的功能. 资源隔离.有些集群是专用的,比如给你三台设备只跑一个 ...
Hadoop部署方式-完全分布式(Fully-Distributed Mode)
Hadoop部署方式-完全分布式(Fully-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本博客搭建的虚拟机是伪分布式环境(https://w ...
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode)
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载相应的jdk和Hadoop安装包 JDK:h ...
Hadoop部署方式-本地模式(Local (Standalone) Mode)
Hadoop部署方式-本地模式(Local (Standalone) Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. Hadoop总共有三种运行方式.本地模式(Local ...
hadoop部署中遇到ssh设置的问题
尽管hadoop和一些培训视频课程上讲分布式部署比较详细,但是在部署时仍遇到了一些小问题,在此mark一下: 1.linux的namenode主机上安装了ssh,也启动了ssh,并且执行了: /etc ...
hadoop部署工具与配置工具
https://github.com/xianglei/phpHiveAdmin 随着Hadoop的推出,大数据处理实现了技术上的落地.但是对于一般的公司和开发者而言,Hadoop依旧是一个陌生或者难 ...
hadoop部署、启动全套过程
Hadoop是Apache基金会的开源项目,为开发者提供了一个分布式系统的基础架构,用户可以在不了解分布式系统的底层细节的情况下开发分布式的应用,充分利用集群的强大功能,实现高速运算和存储.Hadoo ...
hadoop部署错误
hadoop的单机部署很简单也不容易出错,但是对生产环境的价值和意义不大,但是可以快速用于开发. 部署hadoop的错误原因不少,并且很奇怪. 比如,用户名不同,造成客户端和服务器通讯产生认证失败的错 ...

随机推荐

面试必问：MySQL死锁是什么，如何解决？（史上最全）
MySQL死锁接触少,但面试又经常被问到怎么办? 最近有小伙伴在面试的时候,被问了MySQL死锁,如何解决? 虽然也回答出来了,但是不够全面体系化, 所以,小北给大家做一下系统化.体系化的梳理,帮助大 ...
itestwork(爱测试)开源一站式接口测试&敏捷测试工作站 9.0.0 GA 发布，重大升级
(一)itest 简介 itest work (爱测试) 一站式工作站让测试变得简单.敏捷.itest work 包含极简的任务管理,测试管理,缺陷管理,测试环境管理,接口测试,接口Mock 6合1 ...
k8s——deployment
创建deployment [root@master deploy]# kubectl create deploy nginx-deploy --image=nginx:1.7.9 deployment ...
Hive 在工作中的调优总结
总结了一下在以往工作中,对于Hive SQL调优的一些实际应用,是日常积累的一些优化技巧,如有出入,欢迎在评论区留言探讨~ 一.EXPLAIN 查看执行计划二.建表优化 2.1 分区分区表基本操作 ...
报错 ERR !npicode ELIFECYCLE dev: wue-cli-service serve
在系统变量 Path 里面加上:%SystemRoot%\system32,关掉终端,重新启动项目.
DotNet Web应用单文件部署系列
目录一. pubxml文件配置二. 打包wwwroot文件夹三. 混淆dll文件四. csproj文件配置五. 批处理六. Windows服务安装七. ...
Bloom Filter布隆过滤器
简介本质上布隆过滤器是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 "某样东西一定不存在或者可 ...
2019徐州区域赛 ACEFM 题解 & pollard-rho & miller-rabin & 求出每个子树的重心板子
A. Cat 题目大意:你需要在 [L , R] 选取连续的一段,使得这一段的异或和小于给定的数 S. 请求出最长的长度. 做法:我们可以发现 \[(2k) \oplus (2k+1) = 1, (2 ...
【FAQ】HarmonyOS SDK 闭源开放能力 —IAP Kit（2）
1.问题描述: 应用内支付IAP Kit和Payment Kit的区别以及适用场景? 解决方案: IAP Kit是四方支付,仅支持在线虚拟商品,如会员,游戏钻石等,双框架支持全球,目前单框架暂时只支持 ...
使用kk在centos7上离线部署kubesphere v3.0.0详解
环境准备以三台centos 7.7 64bit 为例: 确保所有机器已经安装所需依赖软件(sudo curl openssl ebtables socat ipset conntrack docke ...