Hadoop集群运行

在Hadoop文件参数配置完成之后

在master上操作

su - hadoop

cd /usr/local/src/hadoop/

./bin/hdfs namenode -format

hadoop-daemon.sh start namenode

hadoop-daemon.sh start secondarynamenode

jps

如果看到NameNode和SecondaryNameNode就表示成功

在slave上操作

su - hadoop

hadoop-daemon.sh start datanode

jps

如果看到DataNode就表示成功

在master上操作

su - hadoop

hdfs dfsadmin -report

给用户做免密

ssh-keygen -t rsa

ssh-copy-id slave1

ssh-copy-id slave2

ssh-copy-id master

stop-dfs.sh

start-dfs.sh

start-yarn.sh

jps

如果在master上看到ResourceManager，并且在slave上看到NodeManager就表示成功

hdfs dfs -mkdir /input

hdfs dfs -ls /

mkdir ~/input

vi ~/input/data.txt

hello world

hello hadoop

hello zzz

保存后执行以下命令

hdfs dfs -put ~/input/data.txt /input

hdfs dfs -cat /input/data.txt

hadoop jar /usr/local/src/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/data.txt /output

执行完后要看到map是100%，reduce也是100%，还要看到successfully

hdfs dfs -cat /output/part-r-00000

在windows真机上执行

进入C:\windows\system32\drivers\etc

把此目录下的hosts文件拖到桌面上

右键打开此文件加入ip与主机名的映射关系

保存后拖回原文件

在浏览器上输入master:8088访问可以看到 MapReduce程序刚刚完成的作业

在浏览器上输入master:50070访问namenode和datanode

在浏览器上输入master:50090访问secondarynamenode

停止 Hadoop（非必要步骤）

1.步骤一：停止 yarn

[hadoop@master hadoop]$ stop-yarn.sh

步骤二：停止 DataNode

[hadoop@slave1 hadoop]$ hadoop-daemon.sh stop datanode

stopping namenode

[hadoop@slave2 hadoop]$ hadoop-daemon.sh stop datanode

stopping namenode

步骤二：停止 NameNode

[hadoop@master hadoop]$ hadoop-daemon.sh stop namenode

stopping namenode

步骤三：停止 SecondaryNameNode

[hadoop@master hadoop]$ hadoop-daemon.sh stop secondarynamenode

stopping secondarynamenode

步骤四：查看 JAVA进程，确认 HDFS进程已全部关闭

[hadoop@master hadoop]$ jps

3528 Jps

30838 RunJar

Hadoop集群运行的更多相关文章

Hadoop集群运行JNI程序
要在Hadoop集群运行上运行JNI程序,首先要在单机上调试程序直到可以正确运行JNI程序,之后移植到Hadoop集群就是水到渠成的事情. Hadoop运行程序的方式是通过jar包,所以我们需要将所有 ...
编写hadoop程序，并打包jar到hadoop集群运行
windows环境下编写hadoop程序新建:File->new->Project->Maven->next GroupId 和ArtifactId 随便写(还是建议规范点) ...
简单说明hadoop集群运行三种模式和配置文件
Hadoop的运行模式分为3种:本地运行模式,伪分布运行模式,集群运行模式,相应概念如下: 1.独立模式即本地运行模式(standalone或local mode)无需运行任何守护进程(daemon) ...
编写hadoop程序并打成jar包上传到hadoop集群运行
准备工作: 1. hadoop集群(我用的是hadoop-2.7.3版本),这里hadoop有两种:1是编译好的hadoop-2.7.3:2是源代码hadoop-2.7.3-src: 2. 自己的机器 ...
攻城狮在路上（陆）-- 提交运行MapReduce程序到hadoop集群运行
此种方式不能直接在eclipse中调试代码. 首先需要在src下放置服务器上的hadoop配置文件:core-site.xml\yarn-site.xml\hdfs-site.xml\mapred-s ...
hadoop集群运行jps命令以后Datanode节点未启动的解决办法
出现该问题的原因:在第一次格式化dfs后,启动并使用了hadoop,后来又重新执行了格式化命令(hdfs namenode -format),这时namenode的clusterID会重新生成,而da ...
hadoop集群运行dedup实现去重功能
一.配置开发环境1.我们用到的IDE是eclipse.要用它进行hadoop编程,要给eclipse安装hadoop自带的插件.(有的版本以源码提供插件,需要用户根据需要自己编译)2.用到的eclip ...
基于Docker快速搭建多节点Hadoop集群--已验证
Docker最核心的特性之一,就是能够将任何应用包括Hadoop打包到Docker镜像中.这篇教程介绍了利用Docker在单机上快速搭建多节点 Hadoop集群的详细步骤.作者在发现目前的Hadoop ...
大数据系列（1）——Hadoop集群坏境搭建配置
前言关于时下最热的技术潮流,无疑大数据是首当其中最热的一个技术点,关于大数据的概念和方法论铺天盖地的到处宣扬,但其实很多公司或者技术人员也不能详细的讲解其真正的含义或者就没找到能被落地实施的可行性方 ...

随机推荐

Windows下新建隐藏用户名
Windows下新建隐藏用户名,防止忘记密码
CMU15445 之 Project#0 - C++ Primer 详解
前言这个实验主要用来测试大家对现代 C++ 的掌握程度,实验要求如下: 简单翻译一下上述要求,就是我们需要实现定义在 src/include/primer/p0_starter.h 中的三个类 Ma ...
python素描照片
#!/usr/bin/python # -*- coding: utf-8 -*- from PIL import Image import numpy as np a = np.asarray(Im ...
ssh空闲一段时间后自动断网
ssh空闲一段时间后自动断网用客户端工具,例如securecrt连接linux服务器,有的会出现过一段时间没有任何操作,客户端与服务器就断开了连接. 造成这个的原因,主要是因为客户端与服务器之间存在 ...
Java 集合常见知识点&面试题总结(上)，2022 最新版！
你好,我是 Guide.秋招即将到来(提前批已经开始),我对 JavaGuide 的内容进行了重构完善,公众号同步一下最新更新,希望能够帮助你. 你也可以在网站(javaguide.cn)上在线阅读, ...
NC20806 区区区间间间
NC20806 区区区间间间题目题目描述给出长度为n的序列a,其中第i个元素为 \(a_i\),定义区间(l,r)的价值为 \(v_{l,r} = max(a_i - a_j | l \leqs ...
while循环&&连接的两个条件
做题的时候出现这种情况,把while中用&&连接的两个条件交换一下就会报错. 原因是 while 中是先检查第一个条件,如果第一个就为false就不看下一个了.如果第一个是true再检 ...
git无法使用Tab提示
1.过去git版本: git version 2.获取git-completion.bash脚本,注意将下方链接的版本号改为和git版本一致. https://raw.githubuserconten ...
BZOJ1874 「一本通 6.7 练习 1」【一本通提高博弈论】取石子游戏
「一本通 6.7 练习 1」取石子游戏题目描述小H和小Z正在玩一个取石子游戏. 取石子游戏的规则是这样的,每个人每次可以从一堆石子中取出若干个石子,每次取石子的个数有限制,谁不能取石子时就会输掉游 ...

Hadoop集群运行

在master上操作

在slave上操作

在master上操作

给用户做免密

保存后执行以下命令

在windows真机上执行

停止 Hadoop（非必要步骤）

Hadoop集群运行的更多相关文章

随机推荐

热门专题