2.6用tr进行转换
tr可以对来自标准输入的内容进行字符替换、字符删除以及重复字符压缩。它可以将一组字符变成另一组字符,因而通常也被称为转换命令。
1、tr只能通过stdin(标准输入),而无法通过命令行参数来接受输入。它的调用格式如下:
tr [options] set1 set2
将来自stdin的输入字符从set1映射到set2,然后将输出写入stdout(标准输出)。set1和set2是字符类或字符集。如果两个字符集的长度不相等,那么set2会不断重复其最后一个字符,直到长度与set1相同。如果set2的长度大于set1,那么在set2中超出set1长度的那部分字符则会全部被忽略。
2、将输入字符由大写转换为小写,如
$echo "HELLO WHO IS THIS" |tr 'A-Z' 'a-z'
'A-Z'和‘a-z’都是集合。可以按照需要追加字符或字符类来构造自己定制的集合。
定义集合方式:a、“起始字符-终止字符”这种格式就行了;b、如果“起始字符-终止字符”不是一个连续的字符序列,那么它就会被视为包含了3个元素的集合,也就是:起始字符,-,终止字符。
3、工作原理
通过在tr中使用集合的概念,我们可以轻松地将字符从一个集合映射到另一个集合中。如使用tr进行数字加密和解密
eg:$echo 12345 | tr '0-9' '9876543210'
87654
eg:$echo 87654 | tr '9876543210' '0-9'
又如,ROT13是一个著名的加密算法,在该算法中,文本加密和解密都使用同一个函数。它按照字母表排列顺序执行13个字母的转换。用tr进行ROT13加密:
$echo "tr came, tr saw, tr conquered." | tr 'a-zA-Z' 'n-za-mN-ZA-M'
输出ge pnzr,ge fnj,ge pbadhrerq.
对加密后的密文再次使用同样的ROT13函数,
$echo ge pnzr,ge fnj,ge pbadhrerq. |tr tr 'a-zA-Z' 'n-za-mN-ZA-M'
输出tr came, tr saw, tr conquered.
tr 还可以用来将制表符转换成空格:
$ tr '\t' ' ' <file.txt
4、补充内容
a、用tr删除字符
tr有一个选项-d,可以通过指定需要被删除的字符集合,将出现在stdin中的特定字符清除掉:
$cat file.txt | tr -d 'set1'
#只使用set1,不适用set2
如:
$echo "Hello 123 world 456" | tr -d '0-9'
Hello world
#将stdin中的数字删除并打印出来
b、字符集补集
可以利用-c来使用set1的补集
tr -c [set1] [set2]
set1的补集意味着这个集合中包含set1中没有的所有字符。
ru:
echo hello 1 char 2 next 4 | tr -d -c '0-9 \n'
在这里,补集中包含了除数字、空格字符和换行符之外的所有字符。因为指定了-d,所以这些字符全部都被删除。
c、用tr压缩字符
连续的重复字符应该在压缩成单个字符。经常需要从事的一项任务就是压缩空白字符。
tr的-s选项可以压缩输入中重复的字符。用它来巧妙执行加法
$cat sum.txt
1
2
3
4
5
$cat sum.txt | echo $[ $(tr '\n' '+' ) 0 ]
15
在上面的命令中,tr用来将'\n'替换成'+',因此我们得到了字符串"1+2+3+4+5",但是在字符串的尾部多了一个操作符+,故追加一个0.
又如,摒除多余的换行符
$cat multi_blanks.txt |tr -s '\n'
line1
line2
line3
line4
d、字符类
tr可以像使用集合一样使用各种不同的字符类。
alnum:字母和数字
alpha:字母
cntrl:控制(非打印)字符
digit:数字
graph:图形字符
lower:小写字母
print:可打印字符
punct:标点符号
space:空白字符
upper:大写字母
xdigit:十六进制字符
可按照下面的方式选择并使用所需的字符类
tr [ :class: ] [:class:]
如tr '[:lower:]' '[:upper:]'
2.6用tr进行转换的更多相关文章
- tr命令-转换和删除字符
tr 转换和删除字符 支持标准输入 格式 tr [OPTION]...SET1[SET2] Translate, squeeze, and/or delete characters from stan ...
- tr 字符转换命令
tr:可以用来删除一段信息当中的文字,或者是进行文字信息的替换 语法:tr [parameter] set1 ...参数: -d:删除信息当中的set1这个字符 -s:替换掉重复的字符 举例: 将la ...
- sed tr 批量转换邮箱格式 去除"\n" 行尾添加";"
1:从phpmyadmin上拿下来的数据是这样的: 2:od -c 发现存在\r\n (windows上编码问题) $ od -c sql.csv 先将\r处理掉 $ sed 's/\r//' sql ...
- linux tr命令实现windows文本格式与linux文本格式间的转换
tr 命令 转换和删除字符 选项: -d --delete:删除字符 -s --squeeze-repeats:把连续重复的字符以一个字符表示,即去重 -c –C --complement:取字符集的 ...
- tr DEMO
测试数据: [weblogic@etp-mall-dev7][/tmp]$ cat msn.txt aaa bbb bbb ccc ccc ddd bbb eee aaa ccc bbb sss 转换 ...
- linux的tr命令
tr(translate缩写)主要用于删除文件中的控制字符,或进行字符转换. 语法 tr [ -c | -cds | -cs | -C | -Cds | -Cs | -ds | -s] [ -A] S ...
- 《linux 字符处理》- grep/sort/uniq/tr/paste
一:基本 字符处理主要是文本的搜索和处理. 搜索也主要使用到了 管道 作为媒介. 二: grep 搜索文本 基本语法 * grep [-incv] ’文本’ 文件 * i 不区分大小写 * c 匹配行 ...
- Linux Shell 文本处理工具集锦--Awk―sed―cut(row-based, column-based),find、grep、xargs、sort、uniq、tr、cut、paste、wc
本文将介绍Linux下使用Shell处理文本时最常用的工具:find.grep.xargs.sort.uniq.tr.cut.paste.wc.sed.awk:提供的例子和参数都是最常用和最为实用的: ...
- linux命令--大小写转换命令
1.tr命令 tr命令转换小写为大写 cat aa.txt | tr a-z A-Z 或者 cat aa.txt | tr [:lower:] [:upper:] tr命令大写转换小写 ...
随机推荐
- EasyPlayerPro windows播放器在播放RTMP视频显示重复异常问题解决
问题来源 2017.12.18 今日有杭州某教育领域客户反馈EasyPlayerPro在播放一个rtmp源时,画面显示异常的问题.截图如下: 问题复现 一番思考, 将显示格式改为D3D显示, 正常, ...
- 特殊例子--JavaScript代码实现图片循环滚动效果
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
- (C)位字段(bit-field)
位字段(bit-field) 在存储空间很宝贵的情况下,有可能需要将多个对象保存在一个机器字中,一种常用的方法是:使用类似于编译器符号表的单个二进制位标志集合,外部强加的数据格式(如设备接口等寄存器) ...
- 《C prime plus (第五版)》 ---第11章 字符串和字符串函数
11-1:字符串表示和字符串I/O 1.首先先通过一个整体的例子来初步了解建立,读入和输出字符串的几种方式. #include<stdio.h> #define MSG "你一定 ...
- Spring Boot2.0之多数据源事务管理
结合前面做的小项目,如果我把test01 test02下面的 service 都加了 事务的注解 这样启动时候会报错! 事务管理器里面不能有两个事务!!!! 这时候需要用 @Transactiona ...
- Struts2 自定义输入校验 第五弹
Struts2的校验框架有两种:一种是validate方法,另一种是有效的xml文件. Action中自定义方法的输入校验,对于通过action的method属性所指定的自定义方法myExecute, ...
- 一些rtsp实现的开源代码
* live.com C/S C++ http://www.live555.com * darwin S C++ http://www.opensource.a ...
- 【thrift】vc中使用thrift中文字符串乱码问题解决
问题描述: VC中使用Apache thrift时,如果字符串中包含中文,会出现乱码问题,这个问题的原因是由于thrift为了达到跨语言交互而使用了UTF-8格式发送字符串,这点对java或者C#不会 ...
- codeforces 658C C. Bear and Forgotten Tree 3(tree+乱搞)
题目链接: C. Bear and Forgotten Tree 3 time limit per test 2 seconds memory limit per test 256 megabytes ...
- linux命令学习笔记(45):free 命令
free命令可以显示Linux系统中空闲的.已用的物理内存及swap内存,及被内核使用的buffer.在Linux系统监控的 工具中,free命令是最经常使用的命令之一. .命令格式: free [参 ...