12.1什么是正则表达式

正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序。

vi、grep、awk、sed支持正则表达式,而cp,ls等命令只能使用bash自身的通配符

12.2基础正则表达式

grep高级参数:

grep [-A] [-B] [--color=auto]  'string'   filename

-A:after的意思,除了列出该行外,后续的n行也列出来

-B:before的意思,除了列出该行外,前面的n行也列出来

--color=auto 可将正确的那个选取数据列出颜色

基础正则表达式练习:

例一:查找特定字符串

grep -n ‘the’ regular_express.txt

grep -vn 'the' regular_express.txt   (-v反向选择)

例二:利用中括号[]来查找集合字符

grep -n 't[ae]st' regular_express.txt  (可匹配test或tast)

grep -n '[^g]oo' regular_express.txt  (oo前不能有g的字符)

grep -n '[^[:lower:]]oo' regular_express.txt   ([:lower:]代表a-z的意思)

例三:行首和行尾字符

grep -n '^test' regular_express.txt

(注:^在[]内表示“反向选择”,在[]外表示定位在行首)

grep -n '\.$' regular_express.txt   (找出行尾结束为小数点的那一行)

例四:任意一个字符.与重复字符*

grep -n ‘g..d’ regular_express.txt   (可匹配good,glad等字符)

grep -n 'ooo*' regular_express.txt   (匹配至少两个o以上的字符)

grep -n 'g.*g' regular_express.txt    (找出g开头与g结尾的字符串,.*表示o个或多个任意字符的意思)

例五:限定连续RE字符范围{}

grep -n 'o\{2\}' regular_express.txt  (找出两个o的字符串)

grep -n ‘go\{2,5\}g’ regular_express.txt  (g后有两个到5个o,然后接一个g的字符串)

grep -n ‘go\{2,\}g’ regular_express.txt  (g后有两个及以上的o,然后接一个g的字符串)

基础正则表达式字符:

^word :待查找的字符串(word)在行首

word$ :待查找的字符串(word)在行尾

. :代表一定有一个任意字符的字符

\   : 转义字符,将特殊符号的特殊意义去除

*  : 重复0个或多个的前一个字符

[list] :从字符集合的RE字符里面找出想要选取的字符

[n1-n2]:从字符集合的RE字符里面找出想要选取的字符范围

[^list] :从字符集合的RE字符里面找出不要的字符串或范围

\{n,m\}:连续n到m个的前一个RE字符,\{n\}表示连续n个,\{n,\}表示连续n个及以上

sed工具:(详见sed & awk)

格式:sed [-nefr] [动作]

参数:

-n :使用安静模式,在一般的sed用法中,所有来自STDIN的数据一般都会被列到屏幕上,但如果加上-n参数后,则只有经过sed特殊处理的那一行才会被列出来

-e :直接在命令行模式上进行sed的动作编辑

-f  :直接将sed的动作写在一个文件内,-f filename 则可以执行filename内的sed动作

-r  :sed的动作支持的扩展型正则表达式的语法

-i  :直接修改读取的文件内容,而不是由屏幕输出

动作说明:[n1,[n2]] function

n1,n2不见得会存在,一般代表选择进行动作的行数

function参数:

a :新增,a的后面可以接字符串,而这些字符串会在目前的下一行出现

i  :插入,i 的后面可以接字符串,而这些字符串会在目前的上一行出现

c :替换,c的后面可以接字符串,这些字符串可以替换n1,n2之间的行

s :替换,可以直接进行替换工作,通常这个s可以搭配正则表达式

d :删除,因为是删除,所以d后面通常不接任何参数

p :打印,也就是将某个选择的数据打印出来,通常p会与参数sed -n一起运行

12.3扩展的正则表达式

+ :重复一个或多个的前一个RE字符

? :0个或一个的前一个RE字符

|  :用或的方式找出字符串

() :找出“组”的字符串  (如:egrep -n ‘g(la|oo)d’ regular_express.txt  表示找出glad或good字符串)

()+:多个重复组的判别   (如echo 'AxyzxyzxyzxyzC' | egrep 'A(xyz)+C'  找出开头是A结尾是C,中间有一个以上的“xyz”字符串)

12.4文件的格式化与相关处理

格式化打印 printf:

格式:printf '打印格式' 实际内容

格式方面的几个特殊样式:

  \a 警告声音输出

  \b 退格键

  \f 清除屏幕

  \n 输出新的一行

  \r 亦即Enter按键

  \t 水平的tab按键

  \v 垂直的tab按键

  \xNN NN为两个数字,可以转换数字成字符

关于C语言内,常见的变量格式

  %ns :n代表数字,s代表string,即多个字符

  %ni : n代表数字,i代表interger,即多少整数字数

  %N.nf :n和N都是数字,f代表float,如十个位数,小数点两位为 %10.2f

awk工具 (详见sed & awk):

格式:awk ‘条件类型1{动作1} 条件类型2{动作2} ...’ filename

awk主要是处理每一行的字段内的数据,而默认的字段的分割符为空格键或tab键

变量:

NF : 每一行($0)拥有的字段总数

NR :目前awk所处理的是“第几行”数据

FS :目前的分隔字符,默认是空格键

逻辑运算符:

>  <  >=  <=  ==  !=

例:

cat /etc/passwd | awk '{FS=":"} $3<10 {print $1 "\t" $3}'

cat pay.txt | awk '{if(NR==1) printf "%10s %10s,%10s\n",$1,$4,"Total"} NR>=2 {total=$1+$4 printf "%10s %10d %10.2f\n",$1,$3,total}'

文本比较工具diff:

diff用于比较两个文件之间的区别,并且是以行为单位的,diff也可以比较两个目录

格式:diff [-bBi] from-file to-file

-b :忽略一行当中仅有多个空白的区别(如“about me”和“about           me”视为相同)

-B:忽略空白行的区别

-i:忽略大小写的区别

patch -pN <patch_file  更新

patch -R -pN <patch_file   还原

范例:以/tmp/test内的passwd.old 与passwd.new 制作补丁文件,并更新旧版数据

diff -Naur passwd.old passwd.new >passwd.patch

更新旧文件,变成和新文件一样

patch -p0 <passwd.patch

(pathing file passwd.old)

恢复旧文件的内容

patch -R -p0 <passwd.patch

文件打印pr:

pr /etc/man.config  (打印文本文件man.config)

鸟哥的linux私房菜——第12章 正则表达式与文件格式化处理的更多相关文章

  1. 别人的Linux私房菜(12)正则表达式与文件格式化处理

    vi gerp awk sed支持正则表达式   cp ls不支持,只能使用bash本身的通配符 正则表达式分为基础正则表达式和拓展正则表达式 使用正则表达式注意语系的影响 http://cn.lin ...

  2. 鸟哥的linux私房菜——第五章学习(Linux的文件权限与目录配置)

    ******************第五章学习****************** 1.[重要的三个概念] 1).文件拥有者(使用者):User,该文件/文件夹只能我来读写: 2).群组:Group, ...

  3. 鸟哥的Linux私房菜——第十一章

    视频链接: 土豆:http://www.tudou.com/programs/view/yT0PfIWU720 B站(推荐): http://www.bilibili.com/video/av9877 ...

  4. 鸟哥的linux私房菜——第七章学习(Linux 磁盘与文件系统管理)

    1.1).文件系统特征 我们称呼一个可被挂载的数据为一个文件系统而不是一个分区! 文件系统通常会将这两部份的数据分别存放在不同的区块,权限与属性放置到 inode 中,至于实际数据则放置到 data ...

  5. 鸟哥的linux私房菜——第20章 启动流程、模块管理与loader

    20.1 Linux启动流程分析 Linux启动过程: 按下开机电源后计算机硬件主动读取BIOS来加载硬件信息以及硬件系统的自我测试,之后系统会主动读取第一个可启动的设备(由BIOS设置),此时就可以 ...

  6. 鸟哥的linux私房菜——第六章学习(Linux文件与目录管理)

    ******************第六章学习****************** 1.[文件与目录管理] 在所有目录下面都会存在的两个目录,分别是 "." 与 "..& ...

  7. 鸟哥的linux私房菜学习笔记 __ 命令与文件的搜寻

    连续输入两次[tab]按键就能够知道使用者有多少命令可以下达.那你知不知道这些命令的完整档名放在哪里?举例来说,ls 这个常用的命令放在哪里呢? 就透过 which 或 type 来找寻吧! 范例一: ...

  8. 鸟哥的Linux私房菜——第十七章:Linux 账号与身份管理

    视频链接:http://www.bilibili.com/video/av10669732/ 1. Linux 的账号与群组1.1 使用者识别: UID 与 GID1.2 使用者账号:/etc/pas ...

  9. 鸟哥的linux私房菜 - 第三章 主机规划与磁盘分区

    各硬件装置在linux中的文件名 在linux系统中,每个装置都被当成一个档案来对待. 常见的装置与其在linux中的档名: 磁盘分区 磁盘链接的方式与装置文件名的关系 个人计算机常见的磁盘接口有两种 ...

随机推荐

  1. Maven浅析-3 Ant Vs Maven

    1.什么是Ant? Ant起源是为了取代构建工具Make.它可以跨系统,建立在Java和XML的基础上,而且非常程式化. Ant更像一个脚本工具,我们必须在Ant内显示地声明做任何事情.在<ta ...

  2. php 生成mysql数据字典代码

    由于项目开发用了比较多的表 ,为了快速获取数据字典,通过php代码的方式来获取表结构和表注释.代码如下: <?php /** * 生成mysql数据字典 */ header ( "Co ...

  3. SQL GROUP BY GROUPING SETS,ROLLUP,CUBE(需求举例)

    实现按照不同级别分组统计 关于GROUP BY 中的GROUPING SETS,ROLLUP,CUBE 从需求的角度理解会更加容易些. 需求举例: 假如一所学校只有两个系, 每个系有两个专业, 每个专 ...

  4. 推荐一个很好的富文本web编辑器UEditor

    前天产品提了一个编辑器的bug,本人找是找到了问题的症结,就是不好改.框架是压缩兼混淆后的代码.查一下,好多年前的框架... 咨询了一个同事有关旧框架的事情,他也建议我升级编辑器并帮忙帮我找了UEdi ...

  5. Eclipse中修改SVN用户名和密码方法[转]

    由于在svn 的界面中并没有为我们提供直接更换用户名密码的地方,所以一旦我们需要更换用户名的就需要自己想一些办法. 解决方案: 在Eclipse 使用SVN 的过程中大多数人往往习惯把访问SVN 的用 ...

  6. linux系统编程:进程间通信-mmap

    进程间通信-mmap #include <sys/mman.h> void *mmap(void *addr, size_t length, int prot, int flags, in ...

  7. hdu 3586 Information Disturbing(树形dp + 二分)

    本文出自   http://blog.csdn.net/shuangde800 题目链接:   hdu-3586 题意 给一棵n个节点的树,节点编号为1-n,根节点为1.每条边有权值,砍掉一条边要花费 ...

  8. Java基础知识强化之IO流笔记33:转换流之InputStreamReader的使用

    1. InputStreamReader的使用 InputStreamReader(InputStream is):用默认的编码读取数据 InputStreamReader(InputStream i ...

  9. Android开发全套视频教程在线观看网盘下载

    千锋金牌讲师老罗老师简介: 国内第一批Android教学讲师,10多年软件开发经验,6年多教学经验,曾担任广东电信北京分公司移动事业部项目经理,主持过微软中国平台考试系统.山西省旅游局智能化平台等大型 ...

  10. 关于json中对象的删除

    一个json对象在后台产生了,但是有些数据可能无效或者不合法,所以需要在前台作些例外处理,比如删除掉. json的删除有很多种,直接用过 delete json对象方式. 举例如下 Js代码 var ...