[转载]sed 简明教程
文章转载自酷壳 – CoolShell.cn,作者:陈皓,地址http://coolshell.cn/articles/9104.html
awk于1977年出生,今年36岁本命年,sed比awk大2-3岁,awk就像林妹妹,sed就是宝玉哥哥了。所以 林妹妹跳了个Topless,他的哥哥sed坐不住了,也一定要出来抖一抖。
sed全名叫stream editor,流编辑器,用程序的方式来编辑文本,相当的hacker啊。sed基本上就是玩正则模式匹配,所以,玩sed的人,正则表达式一般都比较强。
同样,本篇文章不会说sed的全部东西,你可以参看sed的手册,我这里主要还是想和大家竞争一下那些从手机指缝间或马桶里流走的时间,用这些时间来学习一些东西。当然,接下来的还是要靠大家自己双手。
用s命令替换
我使用下面的这段文本做演示:
| 1 2 3 4 5 6 7 8 9 | $ catpets.txtThis is my cat  my cat's name is bettyThis is my dog  my dog's name is frankThis is my fish  my fish's name is georgeThis is my goat  my goat's name is adam | 
把其中的my字符串替换成Hao Chen’s,下面的语句应该很好理解(s表示替换命令,/my/表示匹配my,/Hao Chen’s/表示把匹配替换成Hao Chen’s,/g 表示一行上的替换所有的匹配):
| 1 2 3 4 5 6 7 8 9 | $ sed"s/my/Hao Chen's/g"pets.txtThis is Hao Chen's cat  Hao Chen's cat's name is bettyThis is Hao Chen's dog  Hao Chen's dog's name is frankThis is Hao Chen's fish  Hao Chen's fish's name is georgeThis is Hao Chen's goat  Hao Chen's goat's name is adam | 
注意:如果你要使用单引号,那么你没办法通过\’这样来转义,就有双引号就可以了,在双引号内可以用\”来转义。
再注意:上面的sed并没有对文件的内容改变,只是把处理过后的内容输出,如果你要写回文件,你可以使用重定向,如:
| 1 | $ sed"s/my/Hao Chen's/g"pets.txt > hao_pets.txt | 
或使用 -i 参数直接修改文件内容:
| 1 | $ sed-i "s/my/Hao Chen's/g"pets.txt | 
在每一行最前面加点东西:
| 1 2 3 4 5 6 7 8 9 | $ sed's/^/#/g'pets.txt#This is my cat#  my cat's name is betty#This is my dog#  my dog's name is frank#This is my fish#  my fish's name is george#This is my goat#  my goat's name is adam | 
在每一行最后面加点东西:
| 1 2 3 4 5 6 7 8 9 | $ sed's/$/ --- /g'pets.txtThis is my cat---  my cat's name is betty ---This is my dog ---  my dog's name is frank ---This is my fish ---  my fish's name is george ---This is my goat ---  my goat's name is adam --- | 
顺手介绍一下正则表达式的一些最基本的东西:
- ^ 表示一行的开头。如:/^#/ 以#开头的匹配。
- $ 表示一行的结尾。如:/}$/ 以}结尾的匹配。
- \< 表示词首。 如 \<abc 表示以 abc 为首的詞。
- \> 表示词尾。 如 abc\> 表示以 abc 結尾的詞。
- . 表示任何单个字符。
- * 表示某个字符出现了0次或多次。
- [ ] 字符集合。 如:[abc]表示匹配a或b或c,还有[a-zA-Z]表示匹配所有的26个字符。如果其中有^表示反,如[^a]表示非a的字符
正规则表达式是一些很牛的事,比如我们要去掉某html中的tags:
| 1 | <b>This</b> is what <spanstyle="text-decoration: underline;">I</span> meant. Understand? | 
看看我们的sed命令
| 1 2 3 4 5 6 7 8 | # 如果你这样搞的话,就会有问题$ sed's/<.*>//g'html.txt Understand?# 要解决上面的那个问题,就得像下面这样。# 其中的'[^>]' 指定了除了>的字符重复0次或多次。$ sed's/<[^>]*>//g'html.txtThis is what I meant. Understand? | 
我们再来看看指定需要替换的内容:
| 1 2 3 4 5 6 7 8 9 | $ sed"3s/my/your/g"pets.txtThis is my cat  my cat's name is bettyThis is your dog  my dog's name is frankThis is my fish  my fish's name is georgeThis is my goat  my goat's name is adam | 
下面的命令只替换第3到第6行的文本。
| 1 2 3 4 5 6 7 8 9 | $ sed"3,6s/my/your/g"pets.txtThis is my cat  my cat's name is bettyThis is your dog  your dog's name is frankThis is your fish  your fish's name is georgeThis is my goat  my goat's name is adam | 
| 1 2 3 4 5 | $ catmy.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam | 
只替换每一行的第一个s:
| 1 2 3 4 5 | $ sed's/s/S/1'my.txtThiS is my cat, my cat's name is bettyThiS is my dog, my dog's name is frankThiS is my fish, my fish's name is georgeThiS is my goat, my goat's name is adam | 
只替换每一行的第二个s:
| 1 2 3 4 5 | $ sed's/s/S/2'my.txtThis iS my cat, my cat's name is bettyThis iS my dog, my dog's name is frankThis iS my fish, my fish's name is georgeThis iS my goat, my goat's name is adam | 
只替换第一行的第3个以后的s:
| 1 2 3 4 5 | $ sed's/s/S/3g'my.txtThis is my cat, my cat'S name iS bettyThis is my dog, my dog'S name iS frankThis is my fiSh, my fiSh'S name iS georgeThis is my goat, my goat'S name iS adam | 
多个匹配
如果我们需要一次替换多个模式,可参看下面的示例:(第一个模式把第一行到第三行的my替换成your,第二个则把第3行以后的This替换成了That)
| 1 2 3 4 5 | $ sed'1,3s/my/your/g; 3,$s/This/That/g'my.txtThis is your cat, your cat's name is bettyThis is your dog, your dog's name is frankThat is your fish, your fish's name is georgeThat is my goat, my goat's name is adam | 
上面的命令等价于:(注:下面使用的是sed的-e命令行参数)
| 1 | sed-e '1,3s/my/your/g'-e '3,$s/This/That/g'my.txt | 
我们可以使用&来当做被匹配的变量,然后可以在基本左右加点东西。如下所示:
| 1 2 3 4 5 | $ sed's/my/[&]/g'my.txtThis is [my] cat, [my] cat's name is bettyThis is [my] dog, [my] dog's name is frankThis is [my] fish, [my] fish's name is georgeThis is [my] goat, [my] goat's name is adam | 
圆括号匹配
使用圆括号匹配的示例:(圆括号括起来的正则表达式所匹配的字符串会可以当成变量来使用,sed中使用的是\1,\2…)
| 1 2 3 4 5 | $ sed's/This is my \([^,]*\),.*is \(.*\)/\1:\2/g'my.txtcat:bettydog:frankfish:georgegoat:adam | 
上面这个例子中的正则表达式有点复杂,解开如下(去掉转义字符):
正则为:This is my ([^,]*),.*is (.*) 匹配为:This is my (cat),……….is (betty)
然后:\1就是cat,\2就是betty
sed的命令
让我们回到最一开始的例子pets.txt,让我们来看几个命令:
N命令
先来看N命令 —— 把下一行的内容纳入当成缓冲区做匹配。
下面的的示例会把原文本中的偶数行纳入奇数行匹配,而s只匹配并替换一次,所以,就成了下面的结果:
| 1 2 3 4 5 6 7 8 9 | $ sed'N;s/my/your/'pets.txtThis is your cat  my cat's name is bettyThis is your dog  my dog's name is frankThis is your fish  my fish's name is georgeThis is your goat  my goat's name is adam | 
也就是说,原来的文件成了:
| 1 2 3 4 | This is my cat\n  my cat's name is bettyThis is my dog\n  my dog's name is frankThis is my fish\n  my fish's name is georgeThis is my goat\n  my goat's name is adam | 
这样一来,下面的例子你就明白了,
| 1 2 3 4 5 | $ sed'N;s/\n/,/'pets.txtThis is my cat,  my cat's name is bettyThis is my dog,  my dog's name is frankThis is my fish,  my fish's name is georgeThis is my goat,  my goat's name is adam | 
a命令和i命令
a命令就是append, i命令就是insert,它们是用来添加行的。如:
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | # 其中的1i表明,其要在第1行前插入一行(insert)$ sed"1 i This is my monkey, my monkey's name is wukong"my.txtThis is my monkey, my monkey's name is wukongThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam# 其中的1a表明,其要在最后一行后追加一行(append)$ sed"$ a This is my monkey, my monkey's name is wukong"my.txtThis is my cat, my cat's name is bettyThis is my monkey, my monkey's name is wukongThis is my dog, my dog's name is frankThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam | 
我们可以运用匹配来添加文本:
| 1 2 3 4 5 6 7 | # 注意其中的/fish/a,这意思是匹配到/fish/后就追加一行$ sed"/fish/a This is my monkey, my monkey's name is wukong"my.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my fish, my fish's name is georgeThis is my monkey, my monkey's name is wukongThis is my goat, my goat's name is adam | 
下面这个例子是对每一行都挺插入:
| 1 2 3 4 5 6 7 8 9 | $ sed"/my/a ----"my.txtThis is my cat, my cat's name is betty----This is my dog, my dog's name is frank----This is my fish, my fish's name is george----This is my goat, my goat's name is adam---- | 
c命令
c 命令是替换匹配行
| 1 2 3 4 5 6 7 8 9 10 11 | $ sed"2 c This is my monkey, my monkey's name is wukong"my.txtThis is my cat, my cat's name is bettyThis is my monkey, my monkey's name is wukongThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam$ sed"/fish/c This is my monkey, my monkey's name is wukong"my.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my monkey, my monkey's name is wukongThis is my goat, my goat's name is adam | 
d命令
删除匹配行
| 1 2 3 4 5 6 7 8 9 10 11 12 | $ sed'/fish/d'my.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my goat, my goat's name is adam$ sed'2d'my.txtThis is my cat, my cat's name is bettyThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam$ sed'2,$d'my.txtThis is my cat, my cat's name is betty | 
p命令
打印命令
你可以把这个命令当成grep式的命令
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | # 匹配fish并输出,可以看到fish的那一行被打了两遍,# 这是因为sed处理时会把处理的信息输出$ sed'/fish/p'my.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my fish, my fish's name is georgeThis is my fish, my fish's name is georgeThis is my goat, my goat's name is adam# 使用n参数就好了$ sed-n '/fish/p'my.txtThis is my fish, my fish's name is george# 从一个模式到另一个模式$ sed-n '/dog/,/fish/p'my.txtThis is my dog, my dog's name is frankThis is my fish, my fish's name is george#从第一行打印到匹配fish成功的那一行$ sed-n '1,/fish/p'my.txtThis is my cat, my cat's name is bettyThis is my dog, my dog's name is frankThis is my fish, my fish's name is george | 
几个知识点
好了,下面我们要介绍四个sed的基本知识点:
Pattern Space
第零个是关于-n参数的,大家也许没看懂,没关系,我们来看一下sed处理文本的伪代码,并了解一下Pattern Space的概念:
| 1 2 3 4 5 6 7 8 9 10 11 12 | foreach line in file {    //放入把行Pattern_Space    Pattern_Space <= line;    // 对每个pattern space执行sed命令    Pattern_Space <= EXEC(sed_cmd, Pattern_Space);    // 如果没有指定 -n 则输出处理后的Pattern_Space    if(sed option hasn't "-n")  {       print Pattern_Space    }} | 
Address
第一个是关于address,几乎上述所有的命令都是这样的(注:其中的!表示匹配成功后是否执行命令)
[address[,address]][!]{cmd}
address可以是一个数字,也可以是一个模式,你可以通过逗号要分隔两个address 表示两个address的区间,参执行命令cmd,伪代码如下:
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 | boolbexec = falseforeach line in file {    if( match(address1) ){        bexec = true;    }    if( bexec == true) {        EXEC(sed_cmd);    }    if( match (address2) ) {        bexec = false;    }} | 
关于address可以使用相对位置,如:
| 1 2 3 4 5 6 7 8 9 10 | # 其中的+3表示后面连续3行$ sed'/dog/,+3s/^/# /g'pets.txtThis is my cat  my cat's name is betty# This is my dog#   my dog's name is frank# This is my fish#   my fish's name is georgeThis is my goat  my goat's name is adam | 
命令打包
第二个是cmd可以是多个,它们可以用分号分开,可以用大括号括起来作为嵌套命令。下面是几个例子:
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | $ catpets.txtThis is my cat  my cat's name is bettyThis is my dog  my dog's name is frankThis is my fish  my fish's name is georgeThis is my goat  my goat's name is adam# 对3行到第6行,执行命令/This/d$ sed'3,6 {/This/d}'pets.txtThis is my cat  my cat's name is betty  my dog's name is frank  my fish's name is georgeThis is my goat  my goat's name is adam# 对3行到第6行,匹配/This/成功后,再匹配/fish/,成功后执行d命令$ sed'3,6 {/This/{/fish/d}}'pets.txtThis is my cat  my cat's name is bettyThis is my dog  my dog's name is frank  my fish's name is georgeThis is my goat  my goat's name is adam# 从第一行到最后一行,如果匹配到This,则删除之;如果前面有空格,则去除空格$ sed'1,${/This/d;s/^ *//g}'pets.txtmy cat's name is bettymy dog's name is frankmy fish's name is georgemy goat's name is adam | 
Hold Space
第三个我们再来看一下 Hold Space
接下来,我们需要了解一下Hold Space的概念,我们先来看四个命令:
g: 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除 G: 将hold space中的内容append到pattern space\n后 h: 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除 H: 将pattern space中的内容append到hold space\n后 x: 交换pattern space和hold space的内容
这些命令有什么用?我们来看两个示例吧,用到的示例文件是:
| 1 2 3 4 | $ catt.txtonetwothree | 
第一个示例:
| 1 2 3 4 5 6 7 8 9 | $ sed'H;g't.txtoneonetwoonetwothree | 
是不是有点没看懂,我作个图你就看懂了。

第二个示例,反序了一个文件的行:
| 1 2 3 4 | $ sed'1!G;h;$!d't.txtthreetwoone | 
其中的 ’1!G;h;$!d’ 可拆解为三个命令
- 1!G —— 只有第一行不执行G命令,将hold space中的内容append回到pattern space
- h —— 第一行都执行h命令,将pattern space中的内容拷贝到hold space中
- $!d —— 除了最后一行不执行d命令,其它行都执行d命令,删除当前行
这个执行序列很难理解,做个图如下大家就明白了:

就先说这么多吧,希望对大家有用。
(全文完)
(转载本站文章请注明作者和出处 酷壳 – CoolShell.cn ,请勿用于任何商业用途)
[转载]sed 简明教程的更多相关文章
- awk与sed简明教程
		看到大牛写的关于awk和sed的简明教程,写得很好,为了尊重作者,就不全文转载了,这里标记下链接,方便以后查阅. awk简明教程:http://coolshell.cn/articles/9070.h ... 
- sed 简明教程 (转)
		sed 简明教程 2013年2月20日 awk于1977年出生,今年36岁本命年,sed比awk大2-3岁,awk就像林妹妹,sed就是宝玉哥哥了.所以 林妹妹跳了个Topless,他的哥哥sed ... 
- 转载:Github 简明教程
		如果你是一枚Coder,但是你不知道Github,那么我觉的你就不是一个菜鸟级别的Coder,因为你压根不是真正Coder,你只是一个Code搬运工. 但是你如果已经在读这篇文章了,我觉的你已经知道G ... 
- 【转】sed 简明教程
		本文转自:http://coolshell.cn/articles/9104.html awk于1977年出生,今年36岁本命年,sed比awk大2-3岁,awk就像林妹妹,sed就是宝玉哥哥了.所以 ... 
- sed 简明教程
		做个标记 http://coolshell.cn/articles/9104.html sed全名叫stream editor,流编辑器,用程序的方式来编辑文本,相当的hacker啊.sed基本上就是 ... 
- iOS: 学习笔记, Swift与Objective-C混用简明教程(转载)
		Swift与Objective-C混用简明教程 转载自:https://github.com/lifedim/SwiftCasts/tree/master/000_mix_swift_objc 我想很 ... 
- Java8简明教程(转载)
		ImportNew注:有兴趣第一时间学习Java 8的Java开发者,欢迎围观<征集参与Java 8原创系列文章作者>. 以下是<Java 8简明教程>的正文. “Java并没 ... 
- 转载乙醇大师的appium简明教程
		appium简明教程(11)——使用resource id定位(仅支持安卓4.3以上系统) 乙醇 2014-06-28 21:01 阅读:16406 评论:21 appium简明教程(10)——控件定 ... 
- AWK 简明教程
		AWK 简明教程 转自:http://coolshell.cn/articles/9070.html 有一些网友看了前两天的<Linux下应该知道的技巧>希望我能教教他们用awk和sed, ... 
随机推荐
- 2016科幻惊悚《第五波》HD720P.中英双字
			导演: J·布莱克森编剧: 苏珊娜·格兰特 / 阿齐瓦·高斯曼 / 杰夫·皮克纳 / 瑞克·杨西主演: 科洛·莫瑞兹 / 尼克·罗宾森 / 朗·里维斯顿 / 玛姬·丝弗 / 亚历克斯·罗伊 / 更多. ... 
- WPS2013三合一全套精品视频教程-【word,excel,powerpoint】
			WPS2013三合一全套精品视频教程-[word,excel,powerpoint]教程目录: 下载地址:http://www.fu83.cn/thread-184-1-1.html 
- [CareerCup] 12.2 Find the Reason of Crash 找到程序崩溃的原因
			12.2 You are given the source to an application which crashes when it is run. After running it ten t ... 
- [CareerCup] 13.2 Compare Hash Table and STL Map 比较哈希表和Map
			13.2 Compare and contrast a hash table and an STL map. How is a hash table implemented? If the numbe ... 
- nodeJs--模块module.exports与实例化方法;
			在nodejs中,提供了exports 和 require 两个对象,其中 exports 是模块公开的接口,require 用于从外部获取一个模块的接口,即所获取模块的 exports 对象.而在e ... 
- python为什么会有@classmethod?
			今天被问了这么个问题 python为什么要有classmethod? 被问倒了,只能回答:classmethod不需要实例化类,用起来比较方便.这么回答没有什么底细,于是查看了一下python的官方文 ... 
- Linq动态查询简易解决之道(原创)
			因为项目需要使用Linq来查询数据,但是在多条件查询时,需要使用一大堆if(...!=string.empty)等判断条件感觉不是很优雅.网上搜索以下,大概找到了两种办法,一种是老外写的一个类,感觉用 ... 
- Android实现两个ScrollView互相联动,同步滚动的效果
			公众号:smart_android 作者:loonggg 点击"阅读原文",可查看更多内容和干货 最近在做一个项目,用到了两个ScrollView互相联动的效果,简单来说联动效果意 ... 
- Bootstrap系列 -- 29. 按钮组
			单个按钮在Web页面中的运用有时候并不能满足我们的业务需求,常常会看到将多个按钮组合在一起使用,比如富文本编辑器里的一组小图标按钮等 按钮组和下拉菜单组件一样,需要依赖于button.js插件才能正常 ... 
- [AaronYang]C#人爱学不学8[事件和.net4.5的弱事件深入浅出]
			没有伟大的愿望,就没有伟大的天才--Aaronyang的博客(www.ayjs.net)-www.8mi.me 1. 事件-我的讲法 老师常告诉我,事件是特殊的委托,为委托提供了一种发布/订阅机制. ... 
