SHELL脚本攻略(学习笔记)--2.5 tr
tr主要用于映射结果集、压缩和删除字符。我个人感觉特别有用,特别是压缩连续空格(空行)为一个空格(空行),让不规则的信息变得规则。
2.5.1 tr映射
tr [options] [SET1] [SET2]
如果同时指定了SET1和SET2,则实现的是将SET1的符号按位置一一对应映射为SET2中的符号。实际上就是对应替换。
tr接收到stdin后首先会把标记意义上的符号替换为换行符,然后才执行指定的选项参数。什么是标记意义上的符号请看xargs的内容http://www.cnblogs.com/f-ck-need-u/p/5925923.html。
例如:
[root@xuexi tmp]# ls
a b c d logdir one one space.log shdir sh.txt space.log test vmware-root
[root@xuexi tmp]# ls | tr " " "\t" ç由于先替换为换行符,所以有且只有一个文本意义上的空格被替换为制表符
a
b
c
d
logdir
one
one space.log
shdir
sh.txt
space.log
test
vmware-root
如果在SET1中使用了\n,会发现最后的结果中是紧接着命令提示符。就像下面的。这就是因为原本最后一行的尾部是有分行符的,替换之后就没有了分行符。
[root@xuexi tmp]# echo {1..10} | tr "\n" "x"
1 2 3 4 5 6 7 8 9 10x[root@xuexi tmp]#
之所以说tr是映射而不是替换,是因为两个结果集替换的时候符号位置是一一对应的。例如下面例子的第二条命令,因为\n是SET1中的唯一一个也是第一个符号位,所以SET2中只取第一个符号位“X”进行替换。Y字符就被忽略了。
[root@xuexi tmp]# ls | tr "\n" "X"
aXbXcXdXlogdirXoneXone space.logXshdirXsh.txtXspace.logXtestXvmware-rootX
[root@xuexi tmp]# ls | tr "\n" "XY"
aXbXcXdXlogdirXoneXone space.logXshdirXsh.txtXspace.logXtestXvmware-rootX
那么这样就可以实现简单的加密和解密了。
[root@xuexi tmp]# echo "12345" | tr "0-9" "9876543210" ç加密
87654
[root@xuexi tmp]# echo "87654" | tr "0-9" "9876543210" ç解密
12345
上面的过程是将管道左边的12345对应到0-9的展开式0123456789,并将对应位映射到SET2的数字上。解密也是同理。
更典型的是ROT13加密算法,它的加密和解密使用一套字符。它的SET1的字母位和SET2的字母位完全反向成对。例如SET1指定符号是“axy”,如果SET2想将其对应为“opq”,则须将SET1扩展为“axyopq”,SET2扩展为“opqaxy”,最终是(a,x,y,o,p,q)和(o,p,q,a,x,y),这样(a,o)和(o,a)就配对了,无论加密还是解密都能使用这一套字符。将其扩展为A-Z和a-z就是ROT13加密,甚至还可以将0-9也加上去和9-0对应。下面是SET1和SET2的对应式。
ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm
现在加密“I love you”
[root@xuexi tmp]# echo "I love you" | tr "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" "NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm"
V ybir lbh
将“V ybir lbh”解密。
[root@xuexi tmp]# echo "V ybir lbh" | tr "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" "NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm"
I love you
2.5.2 完全对应的替换
默认情况下,当指定的SET1比SET2字符长时,从最后一个对应的位置开始,SET1的剩余字符都和SET2的最后一个字符对应。假如SET1=[1234],SET2=[abc],则3对应c,4也对应c,此时如果tr的操作对象中出现3或者4都会被替换为c。
使用-t可以先截断SET1比SET2中长的字符,例如上面截断多余的4,SET1=[123]和SET2=[abc]就实现了完全对应。
[root@xuexi tmp]# cat x.txt
NO Name SubjectID Mark 备注
1 longshuai 001 56 不及格
2 gaoxiaofang 001 60 及格
3 zhangsan 001 50 不及格
4 lisi 001 80 及格
5 wangwu 001 90 及格
[root@xuexi tmp]# cat x.txt | tr "fang" "jin" ç结果中n和g都被替换为了n
NO Nime SubjectID Mirk 备注
1 lonnshuii 001 56 不及格
2 nioxiiojinn 001 60 及格
3 zhinnsin 001 50 不及格
4 lisi 001 80 及格
5 winnwu 001 90 及格
[root@xuexi tmp]# cat x.txt | tr -t "fang" "jin" çg被截断,只对应替换fan为jin
NO Nime SubjectID Mirk 备注
1 longshuii 001 56 不及格
2 gioxiiojing 001 60 及格
3 zhingsin 001 50 不及格
4 lisi 001 80 及格
5 wingwu 001 90 及格
2.5.3 压缩符号
这功能太爽了。
tr -s [SET1] [SET2]
它可以将指定的连续的SET1的第一个符号压缩并替换为SET2中的第一个,如果不指定SET2就仅仅只压缩。这样可以使结果变得具有固定的格式,传递给其他命令进行文本处理时就方便太多了。
假如x.txt文件中的内容如下,空格有的地方多,有的地方少,也就是说是一个没有格式的文件。
[root@xuexi tmp]# cat x.txt
NO Name SubjectID Mark 备注
1 longshuai 001 56 不及格
2 gaoxiaofang 001 60 及格
3 zhangsan 001 50 不及格
4 lisi 001 80 及格
5 wangwu 001 90 及格
使用tr压缩空格使其变的规则。
[root@xuexi tmp]# cat x.txt | tr -s “" "
NO Name SubjectID Mark 备注
1 longshuai 001 56 不及格
2 gaoxiaofang 001 60 及格
3 zhangsan 001 50 不及格
4 lisi 001 80 及格
5 wangwu 001 90 及格
如果指定SET2,假如替换为-。
[root@xuexi tmp]# cat x.txt | tr -s " " "-"
NO-Name-SubjectID-Mark-备注
1-longshuai-001-56-不及格
2-gaoxiaofang-001-60-及格
3-zhangsan-001-50-不及格
4-lisi-001-80-及格
5-wangwu-001-90-及格
如果指定的SET1或SET2超过1个字符,则两者都只取第一个字符。例如x.txt中的Mark列有两个连续的0,将其替换为a。
[root@xuexi tmp]# cat x.txt | tr -s “"00" "aa"
NO Name SubjectID Mark 备注
1 longshuai a1 56 不及格
2 gaoxiaofang a1 6a 及格
3 zhangsan a1 5a 不及格
4 lisi a1 8a 及格
5 wangwu a1 9a 及格
2.5.4 删除符号和补集
tr -d是删除指定的符号,只能接一个SET1。
[root@xuexi tmp]# cat x.txt | tr -d " "
NONameSubjectIDMark备注
1longshuai00156不及格
2gaoxiaofang00160及格
3zhangsan00150不及格
4lisi00180及格
5wangwu00190及格
tr -c SET1 SET2是求tr操作对象对SET1的补集,然后将补集字符全部替换为SET2。即将tr操作对象中不在SET1中存在的字符替换为SET2的字符。但是SET2如果指定的字符大于1个,则只取最后一个字符作为替换字符。使用-c的时候应该把-c SET1作为一个整体,不要将其分开。
例如:
[root@xuexi tmp]# echo "abcdefo"| tr -c "ao" "y"
ayyyyyoy[root@xuexi tmp]#
上面的是把“abcdefo”除ao的替换为y,即ayyyyyo,但是结果的最后面多了一个y并且紧接着命令提示符。这是因为abcdefo尾部的\n也是ao的补集的一部分,并将其替换为y了。如果不想替换最后的\n,可以在SET1中指定\n。
[root@xuexi tmp]# echo "abcdefo"| tr -c "ao\n" "y"
ayyyyyo
如果SET2指定多个字符,将只取最后一个字符作为替换字符。
[root@xuexi tmp]# echo "abcdefo"| tr -c "ao\n" "ay"
ayyyyyo
[root@xuexi tmp]# echo "abcdefo"| tr -c "ao\n" "yb"
abbbbbo
-c常和-d一起使用,tr -d -c SET1。它先执行-c SET1求出tr操作对象对SET1的补集,再对这个补集执行删除,也就是说最终的结果是SET1类的。注意,-d一定是放在-c前面的,否则执行的就不是删除补集,而是替换补集为-d的最后一个字符d了。
[root@xuexi tmp]# echo "one 1 two 2 three 3"| tr -d -c "[0-9]\n" ç对数字和分行符求补集,并删除这些补集符号
123
[root@xuexi tmp]# echo "one 1 two 2 three 3"| tr -d -c "[0-9] \n" ç多对一个空格求补集,这样结果中就保留空格了
1 2 3
[root@xuexi tmp]# echo "one 1 two 2 three 3"| tr -c "[0-9]\n" -d ç -d选项放在-c选项的后面是替换行为
dddd1ddddd2ddddddd3
[root@xuexi tmp]# echo "one 1 two 2 three 3"| tr -d -c "[a-zA-z]\n" ç保留字母
onetwothree
[root@xuexi tmp]# echo "one 1 two 2 three 3"| tr -d -c "[a-zA-z] \n" ç保留字母的同时保留空格
one two three
从上面补集的实验中可以看到,其实指定的[0-9]和[a-z]是一个类,最终的结果显示的是这个类中的对象。
在tr中可以使用以下几种类。这些类也可以用在其他某些命令中。
[:alnum:]所有的数字和字母
[:alpha:]所有的字母
[:blank:]所有水平空白=空格+tab
的del
[:digit:]所有数字
[:graph:]所有打印字符,不包含空格=数字+字母+标点
[:lower:]所有小写字母
[:print:]所有打印字符,包含空格=数字+字母+标点+空格
[:punct:]所有标点符号
[:space:]所有水平或垂直空白=空格+tab+分行符+垂直tab+分页符+回车键
[:upper:]所有大写字母
[:xdigit:]所有十六进制数字
使用方法例如下面的。例如[:upper:]等价于[A-Z],[:digit:]等价于[0-9]。
[root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:upper:] \n"
ONE TWO THREE
[root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:alpha:] \n"
one ONE two TWO three THREE
[root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:digit:] \n"
1 2 3
SHELL脚本攻略(学习笔记)--2.5 tr的更多相关文章
- Linux Shell脚本攻略 读书笔记
Linux Shell脚本攻略 读书笔记 这是一本小书,总共253页,但内容却很丰富,书中的示例小巧而实用,对我这样总是在shell门前徘徊的人来说真是如获至宝:最有价值的当属文本处理,对这块我单独整 ...
- linux shell 脚本攻略学习20--awk命令入门详解
awk生于1977年,创始人有三个,分别为 Alfred Aho,Peter Weinberger, 和 Brian Kernighan,名称源于三个创始人的姓的首字母. 作用:处理文本文件. awk ...
- Linux Shell脚本攻略学习总结:一
终端打印 终端打印的常用命令有两个:echo和print 首先,我先介绍echo 1.echo echo这个命令接受三种形式的参数,实例如下: echo "Hello World" ...
- linux shell 脚本攻略学习3
1.Bash中的READ命令 #读取n个字符存入变量 read -n number_of_chars variable_name 示例: amosli@amosli-pc:~$ read -n var ...
- linux shell 脚本攻略学习2
1.关于文件描述符和重定向: 文件描述符是与一个打开的文件或数据流相关联的整数.文件描述符0.1以及2是系统预留的. 0——stdin(标准输入) 1——stdout(标准输出) 2——stderr( ...
- linux shell 脚本攻略学习19--sed命令详解
sed(意为流编辑器,英语“stream editor”的缩写)是Unix/linux常见的命令行程序.sed用来把文档或字符串里面的文字经过一系列编辑命令转换为另一种格式输出,即文本替换.sed通常 ...
- Linux Shell 脚本攻略学习--四
linux中(chattr)创建不可修改文件的方法 在常见的linux扩展文件系统中(如ext2.ext3.ext4等),可以将文件设置为不可修改(immutable).某些文件属性可帮助我们将文件设 ...
- Linux Shell脚本攻略学习总结:三
根据扩展名切分文件名 首先,我们先来看两个例子: file_jpg="sample.jgp" name=${file_jpg%.*} echo File name is : $na ...
- Linux Shell脚本攻略学习总结:二
比较与测试 程序中的流程控制是由比较和测试语句来处理的. 我们可以用if,if else 以及逻辑运算符来执行测试,而用一些比较运算符来比较数据项.另外,有一个test 命令也可以用来进行测试.让我们 ...
- linux shell 脚本攻略学习5---find命令详解
1.find命令详解 语法: find base_path#base_path可以是任何位置,find会从该位置向下找 实例: amosli@amosli-pc:~$ find /home/amosl ...
随机推荐
- 【转载】分享一些Qt学习资源,欢迎下载
资源来源:http://bbs.csdn.net/topics/390358737 经过我一翻整理,把一些我收集到的Qt学习资源分享给大家,主要适合新手,老鸟可以直接忽略我.要说明一下,很多资源都是在 ...
- 解决R速度太慢问题
R的速度慢一直被人诟病,最近做一个比较大的dataset的分析,跑得实在太慢,发现症结是R的data frame的index太慢: 以下为测试: gene_list = 1:100000 eQTL_m ...
- 原生javascript里jsonp的实现原理
ajax不能跨域,jsonp可以跨域 跨域的核心思想: 调用(拿到的接口),定义(jsonp核心处理器)分别是不同的script标签里面进行跨script取数据(只有get方式进行取数据 ) ...
- mysql 把文件中的sql语句导入到mysql中
mysql -uroot -proot -Dcollege</home/wwwroot/default/data/xlxxb_2014-10-16.txt;
- CE选择目录对话框(转)
本文转载于http://blog.163.com/zhaojun_xf/blog/static/30050580201132221118479/ 在Wince下要打开目录对话框需要调用函数SHBrow ...
- vs2010编译出的exe“应用程序无法正常启动(0xc0150002)”
今天编译出一个使用ogre1.6.5动态库的应用程序,启动时报"应用程序无法正常启动(0xc0150002)"的错误提示. 编译环境是Win10+VS2010.这个错误可以在Win ...
- Jocket
https://docs.oracle.com/cd/E13150_01/jrockit_jvm/jrockit/geninfo/diagnos/diagnosTOC.html https://blo ...
- Autocad 常用命令
一律使用的简写 1:将多条线段合并成一条多线段[pe] 2:如果发现合并的多线段将自己不想合并的区域合并进去了,别担心,炸开就行了 [x] 3:如果画的线段太长工作区不适应,使用缩放命令.[scale ...
- SSAS处理时“找不到属性键”的解决办法 (转载)
在SSAS中,经常会遇到“Attribute key not found(找不到属性键)”的错误,这种错误通常是由于某个维度属性(Dimension Attribute)的数据没能从Sql Serve ...
- UILabel的使用
UILabel是iOS用于显示文本的控件. 基本属性如下代码所示: UILabel *lbl = [[UILabel alloc] init] ; //设置显示区域 lbl.frame = CGRec ...