1:文本处理工具:

  1:diff and patch : diff是比较文件或者目录的不同,主要有3个用法: diff file1 file2 :比较file1和file2的不同;diff -u file1 file2 >file.path :比较他们的不同并且生成file.path的补丁文件;比较目录的不同:diff -r test1 test2 .

     patch :打补丁,这个命令一般没有,需要用yum install patch -y 来装。diff -u file1 file2 >file.path :生成的补丁file.path 这样用:把file1变的和file2一样:patch file1 file.path  . 但是如果要想把file2变的和file1一样:diff -R file2 file1 .

  2:grep :过滤,过滤的是字符,或者文件中的内容。

    grep xx file :直接寻找file中有xx的行。

    grep -i xx file :过滤的时候不考虑大小写。

    grep -n xx file :找出xx的行,并且在最前面显示行数。   grep -3 xx file :显示xx所在的行,并且显示它前后三行的内容。

    grep -r xx test :执行递归式搜索,不仅显示test中有xx的行,如果test有子目录,还会一直往下搜索。

    grep -c xx file :显示在file中xx总共有多少行,只会显示行数。

    grep -v xx file :显示除过xx行,其他的所有行。

    grep ^root file :查找file中以root开头的行。         grep root$ file :查找file中以root结尾的行。

    有时参数和命令不是单个使用的,会和 | 配合多条命令一起使用达到效果。

  3:cut :剪切文件中的文本字段,并且将其显示到标准输出,不会改变原文件的内容。

    cut -d : -f 2 file :“-d : ”表示指定分隔文件的符号为“ : ” ;“-f 2 ”表示截取以":分隔后的第二段。

    cut -d : -f 2,3 file :表示截取分隔后的2和3段。

    awk命令:对于内容为以下的文件: 1     2    3  4   如果想把2截出来,执行这个命令是不行的。  cut -d " " -f 2 file  截出的内容是空格。

            这个时候就只能用awk命令了。  awk -F " " '{print $2}' file  它可以忽略空格的个数而把2截出来。

    eg:从ifconfig中只把ip截出来:ifconfig eth0|grep "inet "|awk -F " " '{print $2}'  or  ifconfig eth0|grep inet|grep inet6 -v|awk -F " " '{print $2}'

  4:sort命令和uniq命令:(file为一个纯数字文件,对于含有汉字和数字的文件,汉字默认会被排到数字前面)

    sort : sort -n file :从小到大排列。   sort -nr file :从大到小。  sort -nru file :从大到小排列并且剔除重复的部分。

           sort -n file |uniq -u    如果file中有重复的行,会被忽略,不会显示重复的行。

           sort -n file |uniq -d    与-u相反,它会把所有的重复行显示出来。

           sort -n file |uniq -c    标准输出中会有两行,左边一行是数字个数,右边一行是不重复的数字排列。即如果有两个二 会显示 2 2 

  5:tr:转换大小写。  tr 'a-z' 'A-Z' <file   把file全部转换成大写输出。

                    tr 'a-h' 'A-H'  <file  把a-h的字母全部转换成大写输出。

几个简单的文本处理工具:diff,patch,grep,cut,sort,tr的更多相关文章

  1. Linux学习总结(十八)几个简单的文本处理工具cut sort tr split

    1 命令cut 用来截取某一个字段格式 : cut -d '分隔符' [-cf] n, n为数字,表示第几段-d:后面跟分隔符,分割符要加单引号-c:后面接的是第几个字符-f:后面接的是第几段那么意思 ...

  2. Linux Shell 文本处理工具集锦--Awk―sed―cut(row-based, column-based),find、grep、xargs、sort、uniq、tr、cut、paste、wc

    本文将介绍Linux下使用Shell处理文本时最常用的工具:find.grep.xargs.sort.uniq.tr.cut.paste.wc.sed.awk:提供的例子和参数都是最常用和最为实用的: ...

  3. Shell第二篇:正则表达式和文本处理工具

    一 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 生活中处处都是正则:     比如我们描述:4条腿   ...

  4. BASH 正则表达式和文本处理工具

    本节内容 1.  什么是正则 2.  grep 3.  sed 4.  awk 5.  其他补充 一  什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方 ...

  5. 三大文本处理工具grep、sed及awk的简单介绍

    grep.sed和awk都是文本处理工具,虽然都是文本处理工具单却都有各自的优缺点,一种文本处理命令是不能被另一个完全替换的,否则也不会出现三个文本处理命令了.只不过,相比较而言,sed和awk功能更 ...

  6. Linux正则与文本处理工具(10)

    正则表达式 (Regular Expression, RE, 或称为常规表达式)是通过一些特殊字符的排列,用于『查找/替换/删除』一行或多行文字或字符串,简单的说,正则表达式就是用在字串的处理上面的一 ...

  7. R语言:用简单的文本处理方法优化我们的读书体验

    博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html 前言 延续之前的用R语言读琅琊榜小说,继续讲一下利用R语言做一些简单的文本处理.分词的事情.其实 ...

  8. Pyp 替代sed,awk的文本处理工具

    Linux上文本处理工具虽不少,像cut,tr,join,split,paste,sort,uniq,sed,awk这些经典工具让人眼花缭乱,而且都太老了,使用方法都不太人性化,尤其awk,语法简直反 ...

  9. Unix文本处理工具之awk

    Unix命令行下输入的命令是文本,输出也都是文本.因此,掌握Unix文本处理工具是很重要的一种能力.awk是Unix常用的文本处理工具中的一种,它是以其发明者(Aho,Weinberger和Kerni ...

随机推荐

  1. 探究java的intern方法

    本文主要解释java的intern方法的作用和原理,同时会解释一下经常问的String面试题. 首先先说一下结论,后面会实际操作,验证一下结论.intern方法在不同的Java版本中的实现是不一样的. ...

  2. Jmeter系列(29)- 性能指标(2) | 并发数

    并发数 概念 同时承载正常使用系统功能的用户数量:系统能够同时处理请求的数目. 通过问题详解 问题:网站的并发数,究竟指的同时提交请求的用户数目,还是用户同时提交的请求的数目? 答案:根据这句描述&q ...

  3. Dapr + .NET Core实战(四)发布和订阅

    什么是发布-订阅 发布订阅是一种众所周知并被广泛使用的消息传送模式,常用在微服务架构的服务间通信,高并发削峰等情况.但是不同的消息中间件之间存在细微的差异,项目使用不同的产品需要实现不同的实现类,虽然 ...

  4. P6620-[省选联考2020A卷]组合数问题【组合数学,斯特林数】

    正题 题目链接:https://www.luogu.com.cn/problem/P6620 题目大意 给出\(n,x,p,m\)和一个\(m\)次多项式\(f\)求 \[\sum_{k=0}^nf( ...

  5. Redis之品鉴之旅(五)

    Redis事务 原子性:就是最小的单位 一致性:好多命令,要么全部执行成功,要么全部执行失败 隔离性:一个会话和另一个会话之间是互相隔离的 持久性:执行了就执行了,数据保存在硬盘上 典型例子:银行转账 ...

  6. Git提交时默认编辑器Vim换成Notepad++

    在使用GIT进行commit时,会默认使用Vim,其使用较为笨重,改为Notepad++编辑器较为简便. git commit 默认打开Notepad++编辑器配置: 打开git --- bash,输 ...

  7. Go变量与基础数据类型

    一.基础介绍 Go 是静态(编译型)语言,是区别于解释型语言的弱类型语言(静态:类型固定,强类型:不同类型不允许直接运算) 例如 python 就是动态强类型语言 1.Go 的特性: 跨平台的编译型语 ...

  8. 为什么'\x1B'.length===1?\x与\u知识延伸

    背景 先讲一下背景,再说原因 大多数库都会在日志中使用chalk库为console的内容进行上色 被chalk处理后,其原本的内容会被'\x1B...'所包裹 console.log(chalk.bl ...

  9. Hbase修复工具Hbck

    因为前面Hbase2集群出现过一次故障,当时花了一个周末才修好,就去了解整理了一些hbase故障的,事故现场可以看前面写的一篇:Hbase集群挂掉的一次惊险经历 一. HBCK一致性 一致性是指Reg ...

  10. 使用python -m pip install 和 pip install 安装包有什么区别?

    如果去看源码的话,你会发现 pip 作为执行文件的入口点是 pip._internal.main. 另一方面,pip 作为模块运行时入口是 _main.py,而该模块也只是调用 pip.interna ...