目录

正则表达式

基本正则表达式

扩展正则表达式

grep

tr

diff

du

wc

find


正则表达式

正则表达式,又称正规表示法、常规表示法( Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

正则表达式分为 基本正则表达式 和 扩展正则表达式。

元字符就是指那些在正则表达式中具有特殊意义的专用字符

基本正则表达式

字符匹配

元字符 含义
. 匹配单个任意字符
[a-z] 字符范围,只匹配a-z内的任意字符
[ ^a-z] 匹配a-z之外的任意字符

次数匹配

元字符 含义
* 匹配0或任意多个单字符,一般结合 . 使用
\? 匹配前面的字符0次或1次,即前面的字符可有可无
\+ 匹配前面的字符至少一次,即前面的字符至少出现一次
x\{n\} 精确匹配 x 出现次数为 n
x\{n,\} 匹配 x 出现次数至少为 n
x\{n,m\}

匹配 x 出现次数在 n,m 之间

位置匹配

元字符 含义
^ 只匹配行首
$ 只匹配行尾
\<  锚定词首,用于单词的最左侧
\>  锚定词尾,用于单词的最右侧

分组及引用

元字符 含义
\( \) 将一个或多个字符捆绑在一起,当做一个整体
\1,\2,\3.....

向后引用前面被匹配到的第1个、第2个,第3个.....

1、过滤 /etc/passwd 中以s或S开头的行
grep "^[sS]" /etc/passwd
2、过滤 /etc/passwd 中不以小写字母开头的行
grep "^[^a-z]" /etc/passwd
3、过滤 /etc/passwd 中以nologin结尾的行
grep "nologin$" /etc/passwd
4、过滤 /etc/passwd 中以空格开头的行
grep "^ " /etc/passwd
5、过滤 /etc/passwd 中的空行
grep "^$" /etc/passwd 6、过滤 /etc/passwd 中以r开头的行,r后面可以跟0个或任意多个o(也就是说这行的第一个字符必须是r,这行还可以有0个或任意个o)
grep "^ro*" /etc/passwd
7、过滤 /etc/passwd 中以r开头的行,r后面必须跟1个或1个以上的字符(也就是这行第一个字符必须是r,而且这行必须还有其他字符,空格也算字符)
grep "^r." /etc/passwd
8、过滤 /etc/passwd 中r后跟了任意字符,任意字符后跟了 h 的行 (也就是这一行必须得有r和h,而且h必须在r的后面)
grep "r.*h" /etc/passwd 9、过滤/etc/passwd 中,包含 root 单词的行,并且root不和其他字符相邻(空格不算)
grep "\<root\>" /etc/passwd
10、过滤 /etc/passwd 中 r后跟了o o出现0次或者1此的行
grep "ro\?" /etc/passwd
11、过滤 /etc/passwd 中 r后跟了o o出现至少一次的行
grep "ro\+" /etc/passwd
12、过滤 /etc/passwd 中, r后跟了o,o只出现2次的行
grep "ro\{2\}" /etc/passwd
13、过滤 /etc/passwd 中, r 后跟了o ,o出现至少1次至多2次的行
grep "ro\{1,2\}" /etc/passwd
14、 过滤 /etc/passwd 中,r后跟了o, o 至少出现2次的行
grep "ro\{2,\}" /etc/passwd

扩展正则表达式

扩展正则表达式使用 egrep 或者 grep  -E

元字符 含义
? 匹配紧挨在前面的字符 0 次或 1 次
{m,n} 匹配紧挨着前面的字符至少 m 次,至多 n 次
+ 至少匹配前面的字符一次
a|b 匹配 a 或者 b
() 分组
1、匹配 /etc/passwd 中r后紧跟了o,o出现0次或者1次的行
egrep "ro?" /etc/passwd
2、匹配 /etc/passwd 中r后紧跟了o,o出现至少1次至多2次的行
egrep "ro{1,2}" /etc/passwd
3、匹配 /etc/passwd 中r后紧跟了o,o出现至少1次的行
egrep "ro+" /etc/passwd
4、匹配 /etc/passwd 中出现root或者halt的行
egrep "root|halt" /etc/passwd
5、匹配 /etc/passwd 中出现root on或者halt failed的行
egrep "(root on|halt failed)" /etc/passwd

grep

Linux中grep工具的使用

tr

命令 含义
tr   set1  set2 用 set2 的字符替换 set1
tr -d set1 删除 set1 中指定的字符
tr  -s  set1 压缩 set1 中指定的字符
tr -s  set1  set2 用 set2 的字符替换 set1 ,然后压缩 set2 中指定的字符
tr  -ds  set1  set2

先删除 set1 的字符,再压缩 set1 中的字符

eg:  tr  'A-Z'  'a-z'   <  passwd   将passwd中 A-Z 的大写字符全部替换成 a-z 的小写字符,但是并不会改变passwd中的数据

tr  'A-Z'  'a-z'  < passwd  >  passwd2   将passwd中 A-Z 的大写字符全部替换成 a-z 的小写字符,然后写入到 passwd2 中

diff

diff   passwd   passwd2     比较两个文件的不同

这里表示文件passwd和文件passwd2第2行、第4、5行和第7行都不同,并且分别打印出文件1和文件3的第2、4 、5、7 行

diff  passwd    passwd2   > diff.path               将 passwd 和 passwd2 的不同写入到 diff.path文件中

patch  -b  passwd2  diff.path                        用 diff.path文件修改 passwd2 中的不同,最后得到的 passwd2 文件和 passwd 文件一模一样

du

du : 查看目录或文件占用大小

  • 不加参数时,显示当前文件夹下的所有文件夹的磁盘使用情况(包括递归文件夹内的文件夹)
  • -a  给指定文件夹内的所有文件显示磁盘使用情况( 包括层层递归文件 )
  • -s  仅显示总计,即当前目录的大小
  • -h 以人性化方式显示
  • du -sh    /tmp/test     或者      du -sh  /tmp/test/                      显示test文件夹的占用大小
  • du -sh   /tmp/test/*      显示test文件夹内的所有文件和文件夹的占用大小 (不包括递归文件)
  • du -ah  /tmp/test         显示test文件夹内的所有文件的占用大小(包括递归文件)

wc

wc : 统计文件中的数据

  • -  l 统计行数
  • - c 统计字节数
  •       - w 统计字数
  • - m 统计字符数

统计文件夹内文件的个数:         ls -l | grep "^-" | wc -l

统计文件夹内包括递归文件的个数:   ls -lR | grep "^-" | wc -l

统计文件夹内文件夹的个数 :     ls -l | grep "^d" | wc -l

统计文件夹内包括递归文件夹的个数:   ls -lR | grep "^d" | wc -l

find

find :查找文件或文件夹

  • 根据文件名查找     find  /tmp  -name  abc     查找/tmp目录下名字叫做abc的文件,它会遍历tmp目录下的所有文件及文件夹
  • 根据文件大小查找   find /tmp   -size    -1M       +号表示大于  -号表示小于
  • -name   通过文件名查找
  • -size     通过文件大小查找
  • -type    通过文件类型查找
  • -user    通过文件用户查找
  • -perm  通过权限查找
  • 因为find对管道支持比较弱,所以可以借助exec扩展选项
  • find /etc  -size  +1M  -exec  ls  -lh  {}  \;               {}代表find查找到的内容
  • find /etc -size +1M   -exec  cp  {}   /tmp/test/  \;
  • find  /  -type  -newermt  '2018 '  !   -newermt   ''

find命令按时间查找文件

find /etc -atime  3    #查找/etc目录三天之内查看过的文件
find /etc -mtime -3 #查找/etc目录三天之内修改过的文件
find /etc mtime +3 #查找三天前修改过的文件 find /etc -type f -newermt '2014-1-1 00:00:00' ! -newermt '2015-1-1 00:00:00' #查找在2014-1-1 00:00:00和 2015-1-1 00:00:00 之间的文件

相关文章:Linux中grep工具的使用

Linux中awk工具的使用

Linux中sed工具的使用

Linux中正则表达式和字符串的查询、替换(tr/diff/wc/find)的更多相关文章

  1. linux中sort、uniq、cut、tr、wc命令的使用

    文本处理命令 1.sort命令 使用场景 : 用于将文件内容加以排序(可以和cat一起用) 参数 作用 -n 依照数值的大小排序 -r 以相反的顺序来排序(默认只比较第一个数,-rn是按所有数值比较) ...

  2. 07: linux中正则表达式与grep使用

    1.1 linux中正则表达式 1.^linux        以linux开头的行 2.$php         以php结尾的行 3..                匹配任意单字符 4..+  ...

  3. 11、Linux基础--sort、uniq、cut、tr、wc、流处理工具sed

    笔记 1.晨考 1.写出过滤手机号的正则表达式 1[0-9]{10} 2.写出过滤邮箱的正则表达式 chenyang@123.com [a-zA-Z0-9-_]+@[a-z0-9]+\.(com|cn ...

  4. 在Linux中批量修改字符串的命令

    昨天一个朋友忽然问我,在Linux下如何批量修改字符串,当时瞬间懵逼了,完全想不起来....... 今天特意的重温了一下Linux下的一些常用命令,并将这个遗忘的批量修改字符串的命令记录下来(资料来自 ...

  5. linux中shell截取字符串方法总结

    截取字符串的方法一共有八种,主要为以下方法 shell中截取字符串的方法有很多中, ${expression}一共有9种使用方法. ${parameter:-word} ${parameter:=wo ...

  6. node中转换URL字符串与查询字符串

    一个完整的URL字符串中,从"?"(不包括?)到"#"(如果存在#)或者到该URL字符串结束(如果不存在#)的这一部分称为查询字符串. 可以使用Query St ...

  7. SQLServer如何删除字段中的某个字符串,或者替换为空格?

    sql="update Table set 字段=REPLACE ( 字段,'123' , ' ') where XXX条件"把字段中123替换为空格

  8. Linux中命令别名alias与命令替换

    当我们使用bash进行一些操作的时候,希望一些较为长的命令使用一些短的命令即可完成输入运行的话,我们就可以使用alias命令别名来帮助我们完成这个任务 alias作为一个bash的内置命令,具有一定的 ...

  9. linux 中 ll 命令如何让查询结果按时间升序或降序排序?

    -t选项的功能是使输出的结果将以时间降序排列.如果希望按时间的升序排列,可以使用管道符将返回的结果传入tac命令.用法示例:查询当前目录的文件并以降序排列: ll -t查询当前目录的文件并以升序排列: ...

随机推荐

  1. 【秒懂音视频开发】05_Qt开发基础

    控件的基本使用 为了更好地学习Qt控件的使用,建议创建项目时先不要生成ui文件. 打开mainwindow.cpp,在MainWindow的构造函数中编写界面的初始化代码. 窗口设置 MainWind ...

  2. 2020年12月-第02阶段-前端基础-CSS Day05

    CSS Day05 1. 学成在线页面制作 理解 能够说写单页面我们基本的流程 能说出常见的css初始化语句 能说出我们CSS属性书写顺序 应用 能利用ps切图 能引入外部样式表 能把psd文件转换为 ...

  3. 我给Apache顶级项目贡献了点源码。

    这是why技术的第 91 篇原创文章 这篇文章其实并没有什么技术性的分享,从我的角度而言,更多是记录和思考. 把我对于源码和之前写的部分文章反哺给我的一些东西,带来的一点点思考分享给大家. 一行源码 ...

  4. NIO三大组件之Buffer

    什么是Buffer Buffer(这里并不是特指Buffer类)是一个存储数据的容器,与数组类似(其实底层依旧是用数组的结构来存储数据),但不同的是,Buffer对象提供了一组更有效的方法去进行写入和 ...

  5. Linux tar 使用笔记

    常用语法 打包和压缩包 仅打包不压缩:tar -cvf usr.tar /usr 将 /usr 目录打包为 usr.tar 打包并以 gz 格式压缩:tar -czvf usr.tar.gz /usr ...

  6. Radar Scanner Gym - 102220G

    题目链接:https://vjudge.net/problem/Gym-102220G 题意:在水平直角坐标系中有n个矩形,你可以将矩形沿着平行于X轴和Y轴水平移动,问至少经过几次移动可以使得所有的矩 ...

  7. io流(文件字符流(FileReader,FileWriter文件的复制))

    文件字符流(FileReader,FileWriter文件的复制) 文件的复制 效率低的方法 注意:字符流需要刷新操作,字节流不需要,只有刷新后才可以将程序中的内容导入到目标文件中 package c ...

  8. 利用浏览器favicon的缓存机制(F-Cache)生成客户端浏览器唯一指纹

    利用浏览器favicon的缓存机制(F-Cache)生成客户端浏览器唯一指纹 首先介绍下: 这个技术出自 UIC论文:https://www.cs.uic.edu/~polakis/papers/so ...

  9. 如何使用Topshelf与.NET泛型主机建立Windows服务

    1 前置阅读 在阅读本文章之前,你可以先阅读: Topshelf一个用于使用.NET构建Windows服务框架 2 使用 2.1 创建应用程序 首先,创建一个新的控制台应用程序并从nuget获取Top ...

  10. PAT (Advanced Level) Practice 1006 Sign In and Sign Out (25 分) 凌宸1642

    PAT (Advanced Level) Practice 1006 Sign In and Sign Out (25 分) 凌宸1642 题目描述: At the beginning of ever ...