linux du命令的疑惑
起因是测试rsync传输数据。传输完成后,想看一下传输的文件是不是完整,所以检测了下源目录和目标目录的大小,竟然出现了巨大的差距:
[root@w anaconda3]$ du -sh ./
.9G ./
以及
[root@test anaconda3]# du -sh ./
4.7G ./
同样一个anaconda3目录,在新机器占用的磁盘大小竟然比源机器上多了将近2个G!!比原来的目录小还可以理解为传输问题,比原来的目录大就很奇怪了。
在去看看文件的数量是不是一致:
[root@w anaconda3]$ find ./ | wc -l
[root@test anaconda3]$ find ./ | wc -l
数量是一样的,更奇怪了,继续查看子目录大小:
[root@w anaconda3]$ ls| xargs -n du -sh
139M bin
2.0M compiler_compat
4.1M conda-meta
544K doc
envs
40K etc
56M include
.9G lib
680K libexec
.0K LICENSE.txt
52K man
2.6M mkspecs
320K phrasebooks
.6G pkgs
4.2M plugins
6.2M qml
65M share
4.7M ssl
11M translations
484K var
.0K x86_64-conda_cos6-linux-gn
[root@test anaconda3]# ls| xargs -n du -sh
139M bin
2.0M compiler_compat
4.1M conda-meta
540K doc
envs
40K etc
56M include
.8G lib
676K libexec
.0K LICENSE.txt
48K man
2.5M mkspecs
320K phrasebooks
.6G pkgs
4.2M plugins
6.2M qml
65M share
4.7M ssl
11M translations
484K var
.0K x86_64-conda_cos6-linux-gnu
对比一下,发现差距并不大啊(⊙o⊙)…,这就有点奇怪了,从结果来看新机器上"du -sh ./"的结果应该是对的,应该是老机器上执行"du -sh ./"的结果有点问题。
所以关注的重点转移到老机器上的“du”命令。
根据google到的信息,主要集中在下面几点上:
. du和ls的对比:du默认统计的是文件所占用的块的大小,操作系统分配磁盘空间是以块为单位,即使实际使用的空间不足一个块,别的文件也不能使用这个块空间。ls命令统计的是文件使用的实际空间。一般文件du命令的结果会比ls大一些,而特殊文件如“稀疏文件”,du的结果可能会小一些,这应该是和“稀疏文件”的存储方式有关。
2. du命令也可以统计实际空间,使用“-b”选项
3. du -sh ./* 和 du -sh ./ 结果可能不同,因为./*不会匹配隐藏文件,也就是“.name”以“.”开头的文件。同理du -sh * 和 du -sh 结果也可能不同
4. du和df的对比:如果某个文件被删除了,但依然有进程打开了它,那么df会计入这个文件,但du不会;稀疏文件也可能导致不同。
这几点都没有解释在老机器上运行du命令显示的奇怪结果,所以继续试试其他命令,包括列出每个文件的大小并加总等:
find ./ | xargs du -b | awk 'BEGIN {sum=0} ; {sum+=$1} END {print sum}'
find ./ -type l -o -type f| xargs du -b | awk 'BEGIN {sum=0} ; {sum+=$1} END {print sum}'
ls -l -R | awk 'BEGIN {sum=0} ; {sum+=$5} END {print sum}'
ls -a | xargs du -b | awk 'BEGIN {sum=0} ; {sum+=$1} END {print sum}'
find ./ -not -type d | xargs du | awk 'BEGIN {sum=0} ; {sum+=$1} END {print sum}'
find ./ -not -type d | xargs ls -l | awk 'BEGIN {sum=0} ; {sum+=$5} END {print sum}'
ls | xargs -n du -sb | awk 'BEGIN {sum=0} ; {sum+=$1} END {print sum}'
ll | grep -v ^d | awk 'BEGIN {sum=0} ; {sum+=$5} END {print sum}'
du -abhc ./ | wc -l
p.s. xargs命令默认是把所有参数一起放在命令行上传给程序,所以ls -a | xargs du -b的结果可能是du -b a.txt b.txt ...,而xargs -n 1di -b的结果是du -b a.txt;du -b b.txt等。
上面的命令仍然解释不了原因。
google上也提到过rsync传输后目录大小不一致的可能原因:
. 硬链接。rsync默认会把2个硬链接文件复制成两个文件,磁盘占用空间就多了一个文件的大小。
. 稀疏文件。rsync默认不会写这一类文件
检查了一番之后,似乎只有软连接,没什么硬链接。
最后没有办法,试了试VNC链接图形界面:

神奇的发现:这里的文件大小。。。也是不对的。(⊙o⊙)…
这。。。不知道怎么下手了,打算就此打住,姑且当做是一个bug吧。
另外,google上也提到了一个验证文件完整性的方法:通过checksum 校验和验证。
[root@w anaconda3]$ find . -type f \( -exec sha1sum "{}" \; \) | sort -k2, | sha1sum
ab15e4e01e363e69bf80d1d0aecdf101452f85d6 -
[root@test anaconda3]$ find . -type f \( -exec sha1sum "{}" \; \) | sort -k2,2 | sha1sum
ab15e4e01e363e69bf80d1d0aecdf101452f85d6 -
结果一致,但时间上会慢不少。
linux du命令的疑惑的更多相关文章
- LInux : du命令
Linux du命令也是查看使用空间的,但是与df命令不同的是Linux du命令是对文件和目录磁盘使用的空间的查看,还是和df命令有一些区别的. 1.命令格式: du [选项][文件] 2.命令功能 ...
- (转)linux du命令
转自 http://www.cnblogs.com/peida/archive/2012/12/10/2810755.html Linux du命令也是查看使用空间的,但是与df命令不同的是Linux ...
- linux du命令: 显示文件、目录大小
介绍:du命令用于显示指定文件(夹)在磁盘中所占的空间信息.假如指定的文件参数实际上是一个目录,就要计算该目录下的所有文件.假如 没有提供文件参数,执行du命令,显示当前目录内的文件占用空间信息. 语 ...
- python计算文件夹大小(linux du命令 简化版)
C盘又满了,怎么办?用了一些垃圾清理软件(或者bat脚本),但是还是不理想,那么具体哪些文件夹下面有巨大的文件呢?windows并不能通过详细信息看到每个文件夹的大小(PS:这里所谓的文件夹的大小是指 ...
- Linux du命令和df命令区别
du 命令 1.命令格式: du [选项][文件] 2.命令功能: 显示每个文件和目录的磁盘使用空间. 3.命令参数: -a或-all 显示目录中个别文件的大小. -b或-bytes 显示目录或文件大 ...
- 浅谈Linux du命令
**du(disk usage),顾名思义,查看目录/文件占用空间大小** 1.查看当前目录下的所有目录以及子目录的大小 du -h du -ah #-h:用K.M.G的人性化形式显示#-a:显示目 ...
- Linux du命令详解
1.命令:du 2.命令功能:显示每个文件和目录的磁盘使用空间. 3.命令参数 -a或-all #显示目录中个别文件的大小. -b或-bytes #显示目录或文件大小时,以byte为单位. -c或-- ...
- linux sed命令使用疑惑总结
s 替换命令 [zhuhc@test111 ~]$ sed 's/ma/mass' test.txt , : unterminated `s' command 原因:替换命令s末尾的斜杠丢失了.正确命 ...
- 每天一个linux命令(34):du 命令
Linux du命令也是查看使用空间的,但是与df命令不同的是Linux du命令是对文件和目录磁盘使用的空间的查看,还是和df命令有一些区别的. 1.命令格式: du [选项][文件] 2.命令功能 ...
随机推荐
- iOS开发debug集锦
1.添加第三方库时,需要注意使用环境 duplicate symbol _llvm.embedded.module in: /Users/dengw/360Cloud/xcode_code/appli ...
- AngularJS 笔记系列(五)过滤器 filter
过滤器是用来格式化给用户展示的数据的. 在 HTML 中的模板绑定符号{{}} 内通过|符号来调用过滤器. 大写:{{ name | uppercase }} 也可以在 JS 中进行调用$filter ...
- python全栈开发从入门到放弃之装饰器函数
什么是装饰器#1 开放封闭原则:对扩展是开放的,对修改是封闭的#2 装饰器本身可以是任意可调用对象,被装饰的对象也可以是任意可调用对象#3 目的:''' 在遵循 1. 不修改被装饰对象的源代码 2. ...
- 2.MySQL简介
MySQL是一种DBMS,即它是一种数据库软件. 1.连接 为了连接到MyAQL,需要一下信息: ➡️主机名(计算机名)---如果连接到本地MySQL服务器,为localhost ➡️duan ...
- Oblect类之hashCode和equals
1.hashCode的默认实现.显然是一个本地方法. 2.equals的默认实现.默认equals在比较两个对象时,是看他们是否指向同一个地址的.“==”操作比较的是两个变量的值是否相等,对于引用型变 ...
- hihocoder1478 水陆距离
地址:http://hihocoder.com/problemset/problem/1478 题目: 水陆距离 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 给定一个 ...
- Visual studio插件 Reshaper--- 常用快捷键
快速修复 alt+enter (alt+enter唤出快速修复面板,上下方向键进行选择,再次敲击enter键确定修改) 跳转到对象声明 ctl+鼠标左键 重构-重命名(ctl+r+r) esc键退出 ...
- Windows和Ubuntu双系统
1 重装系统:Windows(Win7) 1.1 下载大白菜/老毛桃等工具,把U盘制作成启动盘 1.2 下载windows系统镜像文件放入U盘中 1.3 U盘插入待装系统的主机,开机进入BIOS( ...
- pigeon 介绍
https://github.com/dianping/pigeon Pigeon开发指南 Pigeon是一个分布式服务通信框架(RPC),在美团点评内部广泛使用,是美团点评最基础的底层框架之一. 主 ...
- “凯易迅Calix”实习上机——打折问题
题目要求: 题目记得不太清楚,大概的意思是一个商店的打折方案如下:设一个客户买了n个商品,价格分别是p1,p2,...,pn (1)第一个商品不打折,即cost=p1; (2)第i个商品的折扣d=mi ...