hadoop fsck详解

我们知道fsck是用来检测hdfs上文件、block信息的，但是fsck输出的结果我们是否能看明白呢？

下面我们来看一个fsck输出的结果

hadoop fsck /

########################## 情况一 ####################

Status: HEALTHY

Total size: 3107919020687 B

Total dirs: 142

Total files: 321

Total symlinks: 0

Total blocks (validated): 11738 (avg. block size 264774154 B)

Minimally replicated blocks: 11738 (100.0 %)

Over-replicated blocks: 3605 (30.712217 %)

Under-replicated blocks: 0 (0.0 %)

Mis-replicated blocks: 8011 (68.24842 %)

Default replication factor: 3

Average block replication: 3.3083148

Corrupt blocks: 0

Missing replicas: 0 (0.0 %)

Number of data-nodes: 11

Number of racks: 2

FSCK ended at Fri Nov 10 15:11:47 CST 2017 in 418 milliseconds

The filesystem under path '/' is HEALTHY

注：

这种情况是我们在原来的机架上扩增了一个不同机房的机架

由于hadoop对扩增机房的数据平衡策略是：

1）先拷贝一份数据到新增机架的机器上，然后再在原来机架上删除一份数据

2）所以这里的Over-replicated blocks会显示，是3605 。代表的是集群新增了3605 副本数，超过了默认的副本数

########################## 情况二 ####################

.....................Status: HEALTHY

Total size: 3130802412834 B

Total dirs: 143

Total files: 321

Total symlinks: 0 (Files currently being written: 1)

Total blocks (validated): 11824 (avg. block size 264783695 B)

Minimally replicated blocks: 11824 (100.0 %)

Over-replicated blocks: 0 (0.0 %)

Under-replicated blocks: 755 (6.385318 %)

Mis-replicated blocks: 0 (0.0 %)

Default replication factor: 3

Average block replication: 2.937331

Corrupt blocks: 0

Missing replicas: 755 (2.1275997 %)

Number of data-nodes: 10

Number of racks: 1

FSCK ended at Mon Nov 13 16:59:13 CST 2017 in 69 milliseconds

注：

当新增机房的slave节点和之前的slave节点数据重新平衡后，我把新增机房的节点网络中断，

然后后就出现了 Under-replicated blocks，意思就是集群中有这么多副本数是小于集群指定的副本数。

########################## 情况三 ####################

Status: HEALTHY

Total size: 3130802412834 B

Total dirs: 143

Total files: 322

Total symlinks: 0

Total blocks (validated): 11824 (avg. block size 264783695 B)

Minimally replicated blocks: 11824 (100.0 %)

Over-replicated blocks: 0 (0.0 %)

Under-replicated blocks: 0 (0.0 %)

Mis-replicated blocks: 0 (0.0 %)

Default replication factor: 3

Average block replication: 3.001184

Corrupt blocks: 0

Missing replicas: 0 (0.0 %)

Number of data-nodes: 14

Number of racks: 2

FSCK ended at Mon Nov 13 11:00:37 CST 2017 in 642 milliseconds

注：

这里的是最终达到平衡后的检测结果

参数解释：

status：代表这次hdfs上block检测的结果

Total size: 代表/目录下文件总大小

Total dirs：代表检测的目录下总共有多少个目录

Total files：代表检测的目录下总共有多少文件

Total symlinks：代表检测的目录下有多少个符号连接

Total blocks(validated)：代表检测的目录下有多少个block块是有效的

Minimally replicated blocks：代表拷贝的最小block块数

Over-replicated blocks：指的是副本数大于指定副本数的block数量

Under-replicated blocks：指的是副本数小于指定副本数的block数量

Mis-replicated blocks：指丢失的block块数量

Default replication factor: 3 指默认的副本数是3份（自身一份，需要拷贝两份）

Missing replicas：丢失的副本数

Number of data-nodes：有多少个节点

Number of racks：有多少个机架

hadoop fsck详解的更多相关文章

Hadoop Pipeline详解[摘抄]
最近使用公司内部的一个框架写map reduce发现没有封装hadoop streaming这些东西,查了下pipeline相关的东西 Hadoop Pipeline详解 20. Aug / had ...
Hadoop Streaming详解
一: Hadoop Streaming详解 1.Streaming的作用 Hadoop Streaming框架,最大的好处是,让任何语言编写的map, reduce程序能够在hadoop集群上运行:m ...
hadoop框架详解
Hadoop框架详解 Hadoop项目主要包括以下四个模块 ◆ Hadoop Common: 为其他Hadoop模块提供基础设施 ◆ Hadoop HDFS: 一个高可靠.高吞吐量的分布式文件系统 ◆ ...
Python API 操作Hadoop hdfs详解
1:安装由于是windows环境(linux其实也一样),只要有pip或者setup_install安装起来都是很方便的 >pip install hdfs 2:Client——创建集群连接 ...
hadoop shell 详解
概述所有的hadoop命令均由bin/hadoop脚本引发.不指定参数运行hadoop脚本会打印所有命令的描述. 用法: hadoop [--config confdir] [COMMAND] ...
Hadoop基本命令详解
调用文件系统(FS)Shell命令应使用bin/hadoop fs <args>的形式.所有的的FS shell命令使用URI路径作为参数.URI路径详解点击这里. 1.cat 说明:将路 ...
hadoop命令详解
一.用户命令1.archive命令 (1).什么是Hadoop archives?Hadoop archives是特殊的档案格式.一个Hadoop archive对应一个文件系统目录. Hadoop ...
Hadoop配置文件详解
1 获取默认配置配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知 ...
Hadoop实战之二~ hadoop作业调度详解(1)
对Hadoop的最感兴趣的地方,也就在于Hadoop的作业调度了,在正式介绍如何搭建Hadoop之前,深入理解一下Hadoop的作业调度很有必要.我们不一定能用得上Hadoop,但是如果理通顺Hado ...

随机推荐

为archlinux终端ls不同类型文件设置不同显示颜色
title: 为archlinux终端ls不同类型文件设置不同显示颜色 date: 2017-11-13 20:53:55 tags: linux categories: linux archlinu ...
sql 小技巧
declare @pids varchar(max)='' ),pid)+','+@pids from product where pname like '%red%' select @pids
Django框架详细介绍---ORM相关操作---select_related和prefetch_related函数对 QuerySet 查询的优化
Django的 select_related 和 prefetch_related 函数对 QuerySet 查询的优化引言在数据库存在外键的其情况下,使用select_related()和pre ...
python3.x 读写文件要使用UTF8编码的话需要。。
读写文件常遇到编码不正确的情况,都用UTF8读写文件就好了,在读写的时候加上编码格式:encoding='UTF-8'如下:with open(filename, 'r', encoding='UTF ...
mybatis常见问题和错误
1. jdbc java type 映射关系 1) mysql的text 在mybatis中使用varchar类型 2. mybatis常见的错误 3.There is no getter for p ...
关于java职业路径
java,jvm原理,spring原理,mysql锁,事务,多线程,大并发,分布式架构,微服务,以及相关的项目管理
iptables 初见第一章
官网:https://www.netfilter.org/ 简单来来说 ,netfilter 是一个工作在内核空间的数据包过滤系统,iptables 是一个工作在用户控件.调用netfilter 的规 ...
Python IO内核交互了解
注:Unix \ Linux 环境下的network IO 用户空间与内核空间现在操作系统都是采用虚拟存储器,那么对32位操作系统而言,它的寻址空间(虚拟存储空间)为4G(2的32次方).操作系 ...
CentOS 6.5优化开机启动服务
使用chkconfig命令列举出所有服务,配合管道筛选出开机默认启动的服务,再去掉level0(关机).level4(无意义)和level6(重启)的显示,使结果更直观. chkconfig | gr ...
Codeforces 979E Kuro and Topological Parity - 动态规划 - 组合数学
题目传送门传送点题目大意给定$n$个标号依次为$1, 2, \cdots, n$的点,其中一些点被染成一些颜色,剩下的点没有染色.你需要添加一些有向边并将剩下的点染色,满足有向边从编号小的一端指 ...

hadoop fsck详解

hadoop fsck详解的更多相关文章

随机推荐

热门专题