hadoop 运行测试

hadoop集群运行

需要提前配置配置文件

slave节点用户得是hadoop，/usr/local/src的所有文件得属于hadoop

三台虚拟机关闭setenforce与防火墙，并且配置域名解析

格式化NameNode

[hadoop@master src]$ cd /usr/local/src/hadoop/

[hadoop@master hadoop]$ ./bin/hdfs namenode -format

22/04/02 20:49:35 INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG: Starting NameNode

STARTUP_MSG:   host = master/192.168.3.23

STARTUP_MSG:   args = [-format]

STARTUP_MSG:   version = 2.7.1

启动NameNode

[hadoop@master hadoop]$ hadoop-daemon.sh start namenode

starting namenode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-namenode-master.out

查看java进程

[hadoop@master hadoop]$ jps

10356 NameNode

10427 Jps

5518 SecondaryNameNode

[hadoop@master hadoop]$

slave1启动DataNode

[hadoop@slave1 src]$ hadoop-daemon.sh start datanode

starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave1.out

[hadoop@slave1 src]$ jps

10908 Jps

10511 DataNode

slave2启动DataNode

[hadoop@slave2 hadoop]$ hadoop-daemon.sh start datanode

starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave2.out

[hadoop@slave2 hadoop]$ jps

9763 DataNode

9828 Jps

在windows上做域名解析

将c:\windows\system32\drivers\etc\hosts 拖出桌面

修改，在放回去

启动SecondaryNameNode

[hadoop@master hadoop]$ hadoop-daemon.sh stop secondarynamenode

stopping secondarynamenode

[hadoop@master hadoop]$ hadoop-daemon.sh start secondarynamenode

starting secondarynamenode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-secondarynamenode-master.out

[hadoop@master hadoop]$ jps

13938 NameNode

12980 DataNode

14233 Jps

14190 SecondaryNameNode

master传递公钥（在hadoop用户下）

ssh-keygen

ssh-copy-id slave1

ssh-copy-id slave2

ssh-copy-id master

启动分布式操作系统和资源管理

[hadoop@master .ssh]$ start-dfs.sh

Starting namenodes on [master]

master: namenode running as process 4729. Stop it first.

192.168.3.128: starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave1.out

192.168.3.129: starting datanode, logging to /usr/local/src/hadoop/logs/hadoop-hadoop-datanode-slave2.out

Starting secondary namenodes [0.0.0.0]

0.0.0.0: secondarynamenode running as process 4843. Stop it first.

[hadoop@master .ssh]$ start-yarn.sh

starting yarn daemons

starting resourcemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-resourcemanager-master.out

192.168.3.129: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-nodemanager-slave2.out

192.168.3.128: starting nodemanager, logging to /usr/local/src/hadoop/logs/yarn-hadoop-nodemanager-slave1.out

[hadoop@master .ssh]$ jps

5799 Jps

4729 NameNode

5530 ResourceManager

4843 SecondaryNameNode

[hadoop@master .ssh]$ 

[hadoop@slave1 network-scripts]$ jps

4049 NodeManager

4217 Jps

slave节点出现NodeManager 主节点出现ResourceManager则成功

hadoop创建文件

[hadoop@slave1 network-scripts]$ hdfs dfs -mkdir /input

[hadoop@slave1 network-scripts]$ hdfs  dfs -ls /

Found 1 items

drwxr-xr-x   - hadoop supergroup          0 2022-04-03 11:53 /input

[hadoop@slave1 network-scripts]$

创建文件并上传

[hadoop@master network-scripts]$ mkdir ~/input2

[hadoop@master network-scripts]$ vi ~/input2/data.txt

[hadoop@master network-scripts]$ cat ~/input2/data.txt

Hello   World

Hello   Supermao

Hello   huawei

[hadoop@master ~]$ hdfs dfs -put ~/input/data.txt  /input

[hadoop@master ~]$ hdfs dfs -mkdir /mqy

[hadoop@master ~]$ hdfs dfs -put input/data.txt  /mqy

[hadoop@master ~]$ hdfs dfs -ls /mqy

Found 1 items

-rw-r--r--   2 hadoop supergroup         40 2022-04-03 14:12 /mqy/data.txt

[hadoop@master ~]$ hdfs dfs -cat /mqy/data.txt

Hello World

Hello redhat

Hello supermao

本地主机http://master:50070/explorer.html#/

获得上传的文件

停止

报错

[hadoop@master hadoop]$ hdfs dfsadmin -report

Configured Capacity: 0 (0 B)

Present Capacity: 0 (0 B)

DFS Remaining: 0 (0 B)

DFS Used: 0 (0 B)

DFS Used%: NaN%

Under replicated blocks: 0

Blocks with corrupt replicas: 0

Missing blocks: 0

Missing blocks (with replication factor 1): 0

无法连接存储节点

删除上一次生成的/usr/local/src/hadoop/dfs/data

再次hadoop-daemon.sh start datanode

启动成功

如果启动了datanode，再次格式化namenode

那么就会因为clusterID不一致导致主控与从属无法连接

停止所有服务

stop-all.sh

删除上一次启动datanode的数据，重新启动datanode

此文件记录了datanode

hdfs-site.xml

hadoop 运行测试的更多相关文章

mahout 安装测试
1 下载在http://archive.apache.org/dist/mahout下载相应版本的mahout 版本,获取官网查看http://mahout.apache.org 相关的信息
Hadoop 伪分布式安装、运行测试例子
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚 ...
Hadoop伪分布式集群环境搭建
本教程讲述在单机环境下搭建Hadoop伪分布式集群环境,帮助初学者方便学习Hadoop相关知识. 首先安装Hadoop之前需要准备安装环境. 安装Centos6.5(64位).(操作系统再次不做过多描 ...
【Hadoop测试程序】编写MapReduce测试Hadoop环境
我们使用之前搭建好的Hadoop环境,可参见: <[Hadoop环境搭建]Centos6.8搭建hadoop伪分布模式>http://www.cnblogs.com/ssslinppp/p ...
转载：Hadoop权威指南学习笔记
转自:http://pieux.github.io/blog/2013-05-08-learn-hadoop-the-definitive-guide.html 1 前言 Hadoop的内部工作机制: ...
Hadoop之hive安装过程以及运行常见问题
Hive简介 1.数据仓库工具 2.支持一种与Sql类似的语言HiveQL 3.可以看成是从Sql到MapReduce的映射器 4.提供shall.Jdbc/odbc.Thrift.Web等接口 Hi ...
（升级版）Spark从入门到精通（Scala编程、案例实战、高级特性、Spark内核源码剖析、Hadoop高端）
本课程主要讲解目前大数据领域最热门.最火爆.最有前景的技术——Spark.在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战.课 ...
大数据时代之hadoop(一)：hadoop安装
1.hadoop版本介绍 0.20.2版本以前(不含该版本)的配置文件都在default.xml中. 0.20.x以后的版本不含有eclipse插件的jar包,由于eclipse的版本不一,所以就需要 ...
[Big Data]hadoop分布式系统在Linux系统安装
待完善 Hadoop2.6.0部署与应用一. 环境准备硬件:3台虚拟机内存:至少512MB 硬盘:至少20G 操作系统:rhel6.4 64位最小化安装主机名 IP(局域网) 描述 ...

随机推荐

【vue】中英文切换（使用 vue-i18n ）
一.准备工作 1.vue-i18n 1.仓库地址 2.兼容性:支持 Vue.js 2.x 以上版本 1-1.安装依赖vue-i18n (c)npm install vue-i18n 1-2.使用在 ...
同一套代码部署多个实例来并行完成mysql某项任务，且避免重复执行
我经常会碰到一些耗时较长的任务,譬如更新5千万条表数据中的某个字段,代码中可以通过分页依次读取db,然后更新即可.但是耗时极长,那么能否通过将代码部署多个实例,譬如启动多个docker来并行执行任务, ...
什么时候使用ConcurrentHashMap？
在问题2中我们看到ConcurrentHashMap被作为故障安全迭代器的一个实例,它允许完整的并发检索和更新.当有大量的并发更新时,ConcurrentHashMap此时可以被使用.这非常类似于Ha ...
你如何确保 main()方法所在的线程是 Java 程序最后结束的线程？
我们可以使用 Thread 类的 join()方法来确保所有程序创建的线程在 main()方法退出前结束.
mybatis基础（全）
参考链接:Mybatis学习系列(一)入门简介 Mybatis学习系列(二)Mapper映射文件 Mybatis学习系列(三)动态SQL Mybatis学习系列(四)Mapper接口动态代理 Myba ...
java-中的代理
静态代理: 例子: 接口: public interface InterfaceBase { void proxy(); } 接口实现类: public class InterfaceBaseReal ...
用maven建立一个工程3
在文件夹里面创建一个新文件夹把工程建立在里面
学习Jenkins（二）
一:持续集成的概念: 总体的概括持续集成Continuous Integration 持续交付Continuous Delivery 持续部署Continuous Deployment 二:安装部署 ...
Flask 简单使用,这一篇就够了!
#Flask 安装依赖包及作用 - jinja2 模板语言 (flask依赖包) - markupsafe 防止css攻击 (flask依赖包) - werkzeug --wkz 类似于django中 ...
无人驾驶—高精地图和V2X
高精地图将厘米级的静态信息传传递给无人车V2X将路况上的动态信息传递给无人车高精地图的作用高精地图与传统地图的对比高精地图与定位的关系上图左侧是感知到的区域,右侧是高精地图,之后进行拼接获得车 ...