hadoop管理
hadoop管理工具:
一,dfsadmin工具
dfsadmin 工具用途比较广,既可以查找HDFS状态信息,又可以在HDFS上执行管理操作,以hdfs dfsadmin形式调用,且需要超级用户权限
二, 文件系统检查工具fsck
fsck检查HDFS中问文件的健康状况,该工具会查找那些在所有datanode中缺失的块以及过多或过少的复本块
%hdfs fsck /
fsck 工具从给定的路径开始循环遍历文件系统的命名空间,并检查他所找到的文件
注意:fsck是从namenode获取信息,并不与datanode进行交互操作,因此并不真正获得块数据
查找文件的数据块
%hdfs fsck /user/tom/part-00007 -files -blocks -racks
参数:-files 显示第一行信息,包括文件名称,大小,块数量和健康状况
-blocks 描述文件中各个块的信息,每个块一行
-racks 显示各个块的机架位置和datanode位置
三,datanode块扫描器
各个datanode 运行一个块扫描器,定期检查本节点上的所有块,从而在客户端读到坏块之前及时修复和检测坏块,扫描器使用节流机制,即扫描器工作时占用一部分磁盘带宽
设置 dfs.datanode.scan.period.hours 设置扫描周期
四,均衡器
均衡器是hadoop的一个守护进程,将块从忙碌的datanode 移至空闲的datanode,重新分配块
启动均衡器
%start-balancer.sh
hdfs-site.xml中设置dfs.datanode.balance.bandwidthPerSec 设置均衡器可以使用的带宽
hadoop监控:
hadoop所有的守护进程都会产生日志
一,设置日志级别:
通过 守护进程网页/logLevel目录下来改变log4j日志名称级别
为所有以给定前缀开始的类包启用日志: 1)http://服务/logLevel 2)命令:%hadoop daemonlog -setlevel 守护进程服务:端口 设置选项 日志级别
获取栈追踪:
hadoop守护进程提供一个网页 网页界面/stacks目录 对正在守护进程的JVM中运行着的线程执行线程转存储(thread dump)
委任和解除节点:
向集群添加新节点步骤:
1)将新节点的网络地址添加到include文件
2)运行以下指令,将审核过的一系列datanode集合更新至namenode信息中
%hdfs dfsadmin -refreshNodes
3) 运行以下指令,将审核过的一系列节点管理器更新至资源管理器
%yarn rmadmin -refreshNodes
4) 以新节点更新slaves文件
5)启动新的datanode 和 节点管理器
6)检查新的datanode 和 节点管理器是否都出现在网页界面中
解除旧节点步骤如下:
1)将待解除节点的网络地址添加到exclude文件中,不更新include文件
2)执行以下指令,使用一组新的datanode来更新namenode设置
%hdfs dfsadmin -refreshNodes
3)更新资源管理器设置
%yarn rmadmin -refreshNodes
4)转到网页界面,查看待解除datanode状态是否变为“正在解除”
5)datanode状态变为“解除完毕”,表明所有块复制完成,关闭已经解除节点
6)从include文件中移除这些节点,运行以下命令
%hdfs dfsadmin -refreshNodes
%yarn rmadmin -refreshNodes
7)从slave文件中移除节点
集群升级步骤:
1)执行升级任务前,确保前一升级已经定妥
2)关闭yarn ,mapreduce 守护进程
3)关闭HDFS,备份namenode目录
4)在集群和客户端安装新版本hadoop
5)使用-upgrade期待HDFS
%$NEW_hadoop_home/bin/start-dfs.sh -upgrade
6)等待升级完成
%NEW_hadoop_home/bin/hdfs dfsadmin -upgradeProgress status
7)检验HDFS是否正常运行
8)启动yarn mapreduce守护进程
9)回滚或定妥升级任务
回滚:
%$NEW_hadoop_home/bin/stop-dfs.sh
%$OLD_hadoop_home/bin/start-dfs.sh -rollback
在执行新的升级任务之前,必须执行这一步:
%$NEW_hadoop_home/bin/hdfs dfsadmin -finalizeUpgrade
%$NEW_hadoop_home/bin/hdfs dfsadmin -upgradeProgress status
hadoop管理Web界面:
YARN的Web客户端端口号是8088,通过http://192.168.108.99:8088/可以查看
hadoop管理的更多相关文章
- 查看hadoop管理页面,修改本地hosts,Browse the filesystem
问题: hadoop管理界面,ip:50070,中点击Browse the filesystem会出现网页无法访问,看地址栏,是集群中的主机名::50075/browseDirectory.jsp?n ...
- hadoop 管理命令dfsadmin
hadoop 管理命令dfsadmin dfsadmin 命令用于管理HDFS集群,这些命令常用于管理员. 1. (Safemode)安全模式 动作 命令 把集群切换到安全模式 bin/hdfs df ...
- hadoop基础----hadoop实战(七)-----hadoop管理工具---使用Cloudera Manager安装Hadoop---Cloudera Manager和CDH5.8离线安装
hadoop基础----hadoop实战(六)-----hadoop管理工具---Cloudera Manager---CDH介绍 简介 我们在上篇文章中已经了解了CDH,为了后续的学习,我们本章就来 ...
- Hadoop 管理工具HUE配置-集成Unix用户和用户组
HUE安装完成之后,第一次登录的用户就是HUE的超级用户,可以管理用户,等等.但是在用的过程发现一个问题这个用户不能管理HDFS中由supergroup创建的数据. 虽然在HUE中创建的用户可以管理自 ...
- Hadoop 管理工具HUE配置-hdfs_clusters配置
在HUE的hdfs_clusters中目前主要是配置hdfs相关的,配置好了之后便可以在hue中愉快的管理数据了,不过目前的配置还是比较...简单的.. 里面的配置主要是参考了hue官方文档,还 ...
- Hadoop 管理工具HUE配置-filebrowser配置
Hue提供了图形化截面管理HDFS数据,可谓之非常方便,但是在配置上,还是有点麻烦的. 1 /home/hadoop/software/cloud/hue/desktop/conf/pseudo-di ...
- hadoop基础----hadoop实战(九)-----hadoop管理工具---CDH的错误排查(持续更新)
在CDH安装完成后或者CDH使用过程中经常会有错误或者警报,需要我们去解决,积累如下: 解决红色警报 时钟偏差 这是因为我们的NTP服务不起作用导致的,几台机子之间有几秒钟的时间偏差. 这种情况下一是 ...
- hadoop管理命令
-help 功能:输出这个命令参数手册 -ls 功能:显示目录信息 示例: hadoop fs -ls hdfs://hadoop-server01:9000/ 备注:这些参数中,所有的hdfs ...
- Hadoop 管理工具HUE配置-HBase配置
1 前言 首先要陪只好HBase,可以参见http://www.cnblogs.com/liuchangchun/p/4096891.html,完全分布式类似 2 HBase配置 2.1 HUE 配置 ...
随机推荐
- [No0000105]java sdk 开发环境变量powershell 自动配置脚本
# 设置Java SDK 环境变量 $softwares = Get-ItemProperty HKLM:\Software\Microsoft\Windows\CurrentVersion\Unin ...
- Arcengine 在SDE创建数据集提示应用程序未获得创建或修改此类型数据的方案的许可
解决方案:将license Control的属性修改一下,ArcGIS Engine的√去掉,把第二个打√就可以了: 参考资料:http://www.docin.com/p-925448534.htm ...
- kubenets installation--ranchor-mesos
[kube-proxy]http://www.cnblogs.com/xuxinkun/p/5799986.html [flannel] 安装Flannel [root@master ~]# cd ~ ...
- 中文乱码与字体库windows
设置中文后,查看图形有乱码,文字变成了方块 Win+R打开运行,输入fonts,回车进入Windows字体目录,找到微软雅黑-常规字体,复制出来将文件名修改为msyh.ttf,注意后缀ttf. 将ms ...
- SSL连接分为两个阶段:握手和数据传输阶段
一.SSL概述SSL连接分为两个阶段:握手和数据传输阶段.握手阶段对服务器进行认证并确立用于保护数据传输的加密密钥,必须在传输任何应用数据之前完成握手.一旦握手完成,数据就被分成一系列经过保护的记录进 ...
- 洛谷P2329 栅栏 [SCOI2005] 搜索
正解:搜索 解题报告: 先放下传送门! 首先说下爆搜趴,就直接枚每个需求是否被满足以及如果满足切哪个板子,随便加个最优性剪枝,似乎是有80pts 然后思考优化 首先显然尽量满足需求比较小的,显然如果能 ...
- JdbcTemplate中向in语句传参
spring jdbc包提供了JdbcTemplate和它的两个兄弟SimpleJdbcTemplate和NamedParameterJdbcTemplate,我们先从JdbcTemplate入手, ...
- [GDOI2018]滑稽子图
题目链接:[被和谐] 题目大意:对于一棵树$(V,E)$,对于$S\subset V$,$f(S)$为点集$S$的导出子图的边数.求$\sum_{S\subset V}f(S)^k$ 这里的导出子图说 ...
- P4827 [国家集训队] Crash 的文明世界
传送门:洛谷 题目大意:设$$S(i)=\sum_{j=1}^ndis(i,j)^k$$,求$S(1),S(2),\ldots,S(n)$. 数据范围:$n\leq 50000,k\leq 150$ ...
- 多点数据同步服务器sql汇总
1. a表中是否存在c的列 IF COL_LENGTH('FeeType', 'ftName') IS NOT NULL select N'存在'as result ELSE select N'不存在 ...