Linux下一次删除百万文件

线上环境遇到的一个问题,文件数量过多,执行rm命令报错

# rm -f ./*

-bash: /bin/rm: Argument list too long

根据报错检查状态

# ls | wc -l

634084

# du -sh

64G

在线下环境进行故障复现

测试环境准备

# df -Th

Filesystem     Type   Size  Used Avail Use% Mounted on

/dev/sda3      ext4   1.8T  331G  1.4T  20% /

tmpfs          tmpfs  7.7G     0  7.7G   0% /dev/shm

/dev/sda1      ext4   190M   61M  120M  34% /boot

# grep name /proc/cpuinfo

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

# free -m

total       used       free     shared    buffers     cached

Mem:         15709       1643      14066          8        452        559

-/+ buffers/cache:        631      15078

Swap:         8191          0       8191

# cat /etc/redhat-release

CentOS release 6.8 (Final)

# uname -r

2.6.32-642.1.1.el6.x86_64

测试生成测试数据

# for i in `seq 1000000`;do echo "${i}" >> ${i}.txt;done

# ls | wc -l

1000000

# du -sh

3.9G .

# ls *.txt

-bash: /bin/ls: Argument list too long

# rm -f ./*

-bash: /bin/rm: Argument list too long

方法1:使用for循环方式执行删除任务

# time for i in `ls ./`;do rm -f ${i};done

real   58m44.234s

user  8m59.930s

sys    37m16.453s

时间太长了,绝壁不能忍

方法2:直接删目录

# time rm -rf test && mkdir test

real   0m56.768s

user  0m1.453s

sys    0m22.603s

# du -sh test

4.0K  test

速度不错,然而很多情况下不能直接删目录,有点蛋疼

方法3:使用 find + xargs 组合命令执行删除任务(网上流传最多的方法)

# time find ./ -type f | xargs -n 1 rm -f

real   18m30.267s

user  0m9.536s

sys    1m38.999s

# time find ./ -type f | xargs rm -f

real   16m16.774s

user  0m2.232s

sys    0m30.454s

一样蛋疼,如果需求是删除全部文件的话,用这种方法就太low了,适合删除部分数据的场景

方法4:使用 ls + xargs 组合命令执行删除任务

# time ls | xargs -L 100 rm -f

real   1m3.801s

user  0m7.054s

sys    0m28.582s

# time ls | xargs -L 1000 rm -f

real   0m55.917s

user  0m5.322s

sys    0m24.778s

# time ls | xargs -L 2000 rm -f

real   0m55.560s

user  0m5.209s

sys    0m24.702s

# time ls | xargs -L 5000 rm -f

real   0m55.057s

user  0m5.196s

sys    0m24.666s

# time ls | xargs -L 10000 rm -f

real   0m55.733s

user  0m5.121s

sys    0m24.657s

# time ls | xargs -L 100000 rm -f

xargs: argument list too long

real   0m4.018s

user  0m3.324s

sys    0m0.701s

速度杠杠滴~~但是注意文件名长度,选择合适的传参数量

方法5:使用rsync命令来执行删除任务

# mkdir /tmp/Null

# time rsync --delete-before -d /tmp/Null/ ./

real   0m56.386s

user  0m1.767s

sys    0m28.075s

# ll

total 0

# du -sh ./

29M ./

没什么优点,缺点是rsync命令比较冷门,参数不容易记住,用的机会也不多,作为拓展方法了解一下就好

如果你有其他好的方法,可以一起探讨一下~~

原创文章,侵权必究

Linux下一次删除百万文件的更多相关文章

  1. Linux服务器删除乱码文件和文件夹的方法

    Linux服务器删除乱码文件和文件夹的方法 首页进入乱码文件所在文件夹由于php大势所趋,所以接触Linux服务器的机会越来越多.不同于Windows服务器,Linux服务器只支持数字.英文等字符,对 ...

  2. Linux上删除大量文件几种方式对比

    目录 Linux上删除大量文件几种方式对比 1. rm删除:因为文件数量太多,rm无法删除(报错) 2. find查找删除:-exec 3. find查找删除:xargs 4. find调用-dele ...

  3. linux下删除大量文件提示参数过长解决办法

    linux下删除大量文件提示参数过长解决办法:在当前目录下rm -rf * 在linux中删除大量文件时,直接用rm会出现:-bash: /bin/rm: 参数列表过长的错误. 这时可以用find命令 ...

  4. Linux下删除大量文件效率对比

    来自公众号:马哥Linux运维 今天我们来测试一下Linux下面删除大量文件的效率. 首先建立50万个文件 $ test   for i in $(seq 1 500000);do echo text ...

  5. Linux下删除的文件如何恢复

    Linux下删除的文件如何恢复 参考自: [1]linux下误操作删除文件如何恢复 [2]Linux实现删除撤回的方法 以/home/test.txt为例 1.df -T 文件夹 找到当前文件所在磁盘 ...

  6. 如何恢复 Linux 上删除的文件,第 1 部分

    来源:http://www.ibm.com/developerworks/cn/linux/l-cn-filesrc/ 原理及普通文件的恢复 要想恢复误删除的文件,必须清楚数据在磁盘上究竟是如何存储的 ...

  7. linux下删除乱码文件、目录

    由于编码原因,在linux服务器上上传.创建中文文件或目录时,会产生乱码,如果想删除它,发现用rm命令是删除不了的 这种情况下,用find命令可以删除乱码的文件或目录. 首先进入乱码文件或目录所在的目 ...

  8. linux 下删除乱码文件-乾颐堂

    在linux下删除文件,遇到特殊字符是一件非常头疼的事情. 1. 如果文件名带 ‘-’ 或者‘--’这样的字符 删除办法为:rm -- 文件名 如文件名为:-pythontab.tgz 如果用普通方法 ...

  9. Linux rm 删除指定文件外的其他文件 方法汇总

    一.Linux下删除文件和文件夹常用命令如下: 删除文件: rm file 删除文件夹: rm -rf dir 需要注意的是, rmdir 只能够删除 空文件夹 . 二.删除制定文件(夹)之外的所有文 ...

随机推荐

  1. AngularJS学习篇(十五)

    AngularJS 模块 模块定义了一个应用程序. 模块是应用程序中不同部分的容器. 模块是应用控制器的容器. 控制器通常属于一个模块. 创建模块 你可以通过 AngularJS 的 angular. ...

  2. ThinkPHP模版验证要注意的地方

    Model页面 <?php class LoginModel extends Model { //protected $tableName = 'userinfo'; //表名和model不一致 ...

  3. 【Arduino】2017年电子设计大赛B题 滚球控制系统|板球系统

    今年电赛我们队伍选择的是B题,滚球控制系统.最后我们得到了省特和国一,也算是了结了我大一时的心愿吧.下面对这次比赛进行一下总结,以后回忆起来的时候也有个念想. 滚球控制系统是一个多变量.非线性控制对象 ...

  4. Spring的69个知识点

    目录 Spring 概述 依赖注入 Spring beans Spring注解 Spring数据访问 Spring面向切面编程(AOP) Spring MVC Spring 概述 1. 什么是spri ...

  5. [转]ORACLE SQL解析之硬解析和软解析

    http://blog.chinaunix.net/uid-25909722-id-3363789.html 当客户端进程,将SQL语句通过监听器发送到Oracle时, 会触发一个Server pro ...

  6. 使用webpack配置vue项目代理 (超简单)

    我们都知道,前端开发跨域是一个很常见的问题,当然跨域的方法也有很多,现在我就给大家分享一个在vue项目中如何使用webpack做代理,步骤简单,操作方便,本人亲测,巨好使

  7. 用JAVA中BufferedImage画出漂亮的验证码点击变化

    如果我们想用JAVA中BufferedImage画出漂亮的验证码点击变化怎么实现呢,类似这样: 点击变化,以下是实现过程,直接上代码: 首先前台:<i><img style=&quo ...

  8. 用JavaScript实现表格编辑器

    实现效果: htm l代码: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> ...

  9. 线程&进程&协程

    线程 线程是应用程序中工作的最小单元,它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务.Threading用 ...

  10. jqGrid数据表格

    方式一: <!DOCTYPE html><html><head><meta charset="utf-8" /><title& ...