find文本处理(locate)实例学习记录
find文本处理(locate)实例学习记录
(一)按文件名称查找
按照文件名称查找是 find 最常见的用法,需要注意的是,搜索的文件名必须完全匹配,才能找到对应的文件。
1. 查找当前目录下所有 go 文件
find . -name "*.go"
2. 在 etc 目录下,查找大写字母开头的 txt 文件
find /etc -name "[A-Z]*.txt" -print
3. 在当前目录下查找不是 out 开头的 txt 文件
find . -name "out*" -prune -o -name "*.txt" -print
4. 在当前目录除 git 子目录外查找 txt 文件
find . -path "./git" -prune -o -name "*.txt" -print
5. 找出某个文件的所有硬链接,ls 命令 -i 选项可以查看文件的 inode 号
ls -i 1.txt
138956 1.txt
$ find . -num 138956
这里补充一个小技巧,搜索文件时使用 -iname 参数可以忽略文件名称大小写
(二)按文件类型查找
1. 在当前目录下,查找软连接文件
find . -type l -print
2. 在当前目录下,查找 log 结尾的普通文件,f 表示普通文件类型
find . -type f -name "*.log"
(三)按文件大小查找
1. 查找小于 64k 的文件
find . -size -64k -print
2. 查找大小超过 200M 的文件
find . -size +200M -type f -print
(四)按时间查找
1. 查找 2 天内被修改过的文件
find . -mtime -2 -type f -print
2. 查找 2 天前被更改过的文件,-mtime 表示内容修改时间
find . -mtime +2 -type f -print
3. 查找一天内被访问的文件,-atime 表示访问时间
find . -atime -1 -type f -print
4. 查找一天内状态被改变的文件,-ctime 表示元数据被变化时间
find . -ctime -1 -type f -print
5. 查找比 chopin.txt 新的文件
$ find . -newer "chopin.txt" -type f -print
$ find . ! -newer "chopin.txt" -type f -print # 旧
(五)根据权限查找
1. 查找当前目录权限为 644 的文件
find . -type f -perm 644
2. 查找 etc 目录下至少有一个用户有写权限的文件
find /etc -type f -perm /222
3. 查找 etc 目录下所有用户都有执行权限的文件
find /etc -perm -111 -ls
(六)组合条件
1. 查找当前目录下属于 chopin 用户的普通文件,-a 可以省略
find . -type f -a -user chopin -print
2. 查找当前目录下大于 2M 或 2 天前被修过的文件
find . -size +2M -o -mtime +2 -print
3. 查找当前目录下不是普通文件
$ find . -not -type f
$ find . ! -type f
4. 查找非空文件
find . ! -empty
(七)处理动作
find 根据上述各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来
1. -print 默认为打印,可省略
find . -name "*.log" -print
find . -name "*.log" # 等价
2. -ls 以 ls 长文件的格式形式输出
$ find . -name "*.txt" -ls
138957 4 -rw-r--r-- 1 root root 16 Jan 24 23:20 ./a.txt
138959 4 -rw-r--r-- 1 root root 172 Jan 24 13:06 ./T.txt
138956 4 -rw-r--r-- 1 root root 27 Jan 24 23:28 ./1.txt
3. -delete 删除查找到的文件
find . -size +100M -delete
4. -exec 将查找到的文件传递给 command 命令。下边例子是将查找到的文件传递给了 ls 命令,同理我们可以传递给任何一个 Linux 命令,功能十分强大,也很灵活。
$ find . -name "*.txt" -exec ls -lh {} \;
-rw-r--r-- 1 root root 16 Jan 24 23:20 ./a.txt
-rw-r--r-- 1 root root 172 Jan 24 13:06 ./T.txt
-rw-r--r-- 1 root root 27 Jan 24 23:28 ./1.txt
5. -ok 与 -exec 功能一样,只是操作时会提示用户确认,仅此而已。当然,在生产环境上,我们还是推荐使用 ok
(八)经典案例
如果存在一个名称乱码的文件,想要删除它,该怎么办?即使我们复制乱码名称到命令行,很有可能终端不能正确识别。不用担心,下边来展示下 find 是如何优雅的解决问题的。
$ ls -i
138957 a.txt 138959 T.txt 132395 ڹ��.txt
$ find . -inum 132395 -exec rm {} \;
命令中,-inum 指定的是文件的 inode 号,它是系统中每个文件对应的唯一编号,find 通过编号找到后,执行删除操作。
################################################################################
find总结:
find命令格式:
find path -option [-exec ...]
################################################################################
####按文件名查找
-name:按照文件名称查找,准确匹配;-iname:不区分文件名的大小写;-inode:按照文件 inode 号查找;
####按照文件类型查找
按照文件类型查找,可以使用 -type 选项,具体支持的文件类型如下:
f:普通文件d:目录文件l:链接文件s:套接字文件p:管道文件b:块设备文件,比如:磁盘c:字符设备文件,比如:键盘、鼠标、网卡
####按照文件从属关系查找
-user:以用户名查找-group:以组名查找-uid:以用户 ID 查找-gid:以组 ID 查找-nouser:查找没有属主的文件-nogroup:查找没有属组的文件
####按照文件大小查找
按照文件大小查找功能十分常用,用 -size 选项,选项后边指定大小 1024M,表示大小的格式有如下几种:
-5M:查找小于 5M 的文件+5M:查找大于 5M 的文件5M:查找大小为 5M 的文件
单位支持的有 c(字节)、k、M、G 等,需要注意的是默认单位并不是字节,而是 b,大小为 512 字节。
####按照时间查找
按照时间查找的功能对系统管理员来说,十分常用,find 支持如下几种时间类型:
atime:以访问时间查找mtime:以数据修改时间查找ctime:以元数据修改时间查找newer:以文件为条件,判断比它新的文件
按时间查找时,使用格式如下:
-atime -5:表示 5 天内访问过的文件;-atime +5:表示 6 天前访问过的文件;-atime 5:表示前 5-6 那一天访问的文件;

find 不仅可以按 天 为单位来查找文件,可以按照 amin、mmin、cmin 来查找,区别只是 min 选项单位为分钟。
#######按照权限查找
按权限查找是通过 -perm 选项,可以按照如下方式使用:
-perm 644:精确权限查找-perm /666:任何一类用户中的任何一位符合条件即满足-perm -222:每一类用户的每一位同时符合条件即满足
组合条件
find 可以使用多个条件的组合,支持 -a、-o、-not 或 !,比较简单,不再详细描述其含义。
处理动作
find 根据各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来。
-print:打印,默认动作,可省略-ls:以 ls 长文件格式输出-delete:删除查找到的文件-exec:查找到的文件传递给任何 Linux 命令-ok:与 exec 功能相同,区别是需要用户确认每次的操作
虽然 find 功能非常强大,但要知道的是,find 执行过程是通过扫描磁盘文件来进行查找的,如果大范围的查找文件,需要花费的时间很长,且消耗服务器 cpu 资源。
这里推荐另一个 Linux 文件查找神器 locate,类似于 win 平台下的 everything。它基于索引表进行查询,查询速度非常快,基本不占用 cpu 资源。
yum install -y mlocate ######yum安装
updatedb #####刷新数据库
locate xxx.txt #####
find文本处理(locate)实例学习记录的更多相关文章
- [c#]asp.net开发微信公众平台(4)关注事件、用户记录、回复文本消息
上一篇已经把所有消息封装且都各自有方法处理了,这篇从使用第一步——关注开始, 关注之后进行消息记录,同时回复文本消息给用户,关注方法:DoSub,另外新用户扫描带参数的二维码关注方法:DoCodeN ...
- 关于如何获取/清除 MAXScript 侦听器内的文本
关于如何获取/清除 MAXScript 侦听器内的文本 用来保存记录?还没想到实际用处,先记上. macroRecorder as string listener as stringclearList ...
- DoctorNote医生处方笔记开发记录
1.开发背景 一个开诊所的中医朋友,希望我能给他开发一个记录病人姓名和处方的Android手机app,以便查询病人每次就诊信息,比如上一次的处方,以前他要找个病人上一次的就诊处方,几乎要翻遍一叠厚厚的 ...
- Mahout文本向量化
在文本聚类之前,首先要做的是文本的向量化.该过程涉及到分词,特征抽取,权重计算等等.Mahout 提供了文本向量化工具.由于Mahout 向量化算法要处理的文件是Hadoop SequenceFile ...
- C#中富文本编辑器Simditor带图片上传的全部过程(MVC架构的项目)
描述:最近c#项目中使用富文本编辑器Simditor,记录一下以便以后查看. 注:此项目是MVC架构的. 1.引用文件 项目中引用相应的css和js文件,注意顺序不能打乱,否则富文本编辑器不会正常显示 ...
- c#中富文本编辑器Simditor带图片上传的全部过程(项目不是mvc架构)
描述:最近c#项目中使用富文本编辑器Simditor,记录一下以便以后查看. 注:此项目不是MVC架构的. 1.引用文件 项目中引用相应的css和js文件,注意顺序不能打乱,否则富文本编辑器不会正常显 ...
- Linux终端回话记录和回放工具 - asciinema使用总结
目前linux终端回放工具常见的就是asciinema和script了, 这两种工具都有那种类似于视频回放的效果.虽然这样做的代价是录制过程中需要占用一定的cpu资源以及录制后可能会因为视频文件太大而 ...
- JDBC处理文本和二进制文件
JDBC支持文本(CLOB)和二进制(BLOB)文件的处理,比如要往数据库里存取文章或者图片.这都是用流的思想来解决的. 来两个Demo看看JDBC是怎么操作文本和二进制文件的. CLOB: pack ...
- 使用Arduino和SD卡模块记录数据并导出到Excel
在本篇文章中,我们将学习如何基于Arduino开发板使用一个SD卡模块.同时结合DS3231实时时钟模块,我们将制作一个数据记录仪的示例,在示例中,我们将温度传感器的数据存储到SD卡中,并将这些数据导 ...
随机推荐
- Ubuntu 18.04 + pip3 install virtualenvwrapper 找不到virtualenvwrapper.sh
Reference Ubuntu 18.04 只自带python3.6.5, 因此不想装python2了, 但通过apt install 装virtualenvwrapper时发现必须得装python ...
- ES6 version repeatify
ES6 version repeatify String.prototype.repeatify = String.prototype.repeatify || function (times = 1 ...
- Flutter & App
Flutter & App Android & iOS https://flutter.dev/docs/deployment/flavors https://flutter.dev/ ...
- taro weapp
taro weapp 开发指南 https://nervjs.github.io/taro/docs/GETTING-STARTED.html#微信小程序 taro # build $ taro bu ...
- React LifeCycle Methods & re-learning 2019
React LifeCycle Methods & re-learning 2019 v16.9.0 https://reactjs.org/docs/react-component.html ...
- ES6 声明变量的六种方法
ES5 只有两种声明变量的方法: var 命令和 function 命令. ES6 除了添加 let 和 const 命令, 后面章节还会提到, 另外两种声明变量的方法: import 命令和 cla ...
- eclipse中lombok注解不生效
现象:eclipse中在对象上使用lombok的@Data,引用get方法时,没有set.get方法. 解决办法: 1.在lombok官网(https://www.projectlombok.org/ ...
- .Net -- NLog日志框架配置与使用
NLog是适用于各种.NET平台(包括.NET标准)的灵活,免费的日志记录平台,NLog可将日志写入多个目标,比如Database.File.Console.Mail.下面介绍下NLog的基本使用方法 ...
- Python 学习笔记(2)
python 引号 Python 可以使用引号( ' ).双引号( " ).三引号( ''' 或 """ ) 来表示字符串,引号的开始与结束必须是相同类型的. ...
- Python逻辑面试题
1 # *****************************列表操作***************************** 2 # names = ["Lihua",&q ...