Shell命令-文件及内容处理之sort、uniq
文件及内容处理 - sort、unip
1. sort:对文件的文本内容排序
sort命令的功能说明
sort命令用于将文本文件内容加以排序。sort可针对文本文件的内容,以行为单位来排序。
sort命令的语法格式
sort[OPTION]... [FILE]...
sort[-bcdfimMnr][-o][-t][+-][--help][--verison][文件]
sort命令的常用参数说明:
split参数很多,表1为sort命令的参数及说明:
表1:
sort命令的参数及说明
| 参数选项 | 解释说明 |
|---|---|
| -b | 忽略每行前面开始出的空格字符。 |
| -c | 检查文件是否已经按照顺序排序。 |
| -d | 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。 |
| -f | 排序时,将小写字母视为大写字母。 |
| -i | 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。 |
| -m | 将几个排序好的文件进行合并。 |
| -M | 将前面3个字母依照月份的缩写进行排序。 |
| -n | 依照数值的大小排序。 |
| -o | 将排序后的结果存入指定的文件。 |
| -r | 以相反的顺序来排序。 |
| -t | 指定排序时所用的栏位分隔字符。 |
| + | - 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。 |
| --help | 显示帮助。 |
| --version | 显示版本信息。 |
sort命令的实践操作
范例1: 在使用
sort命令以默认的式对文件的行进行排序,使用的命令如下:
--------------------------------------------------------------
==>testfile文件原有排序 <==
--------------------------------------------------------------
[root@web01 ~]# cat testfile
test 30
Hello 95
Linux 85
--------------------------------------------------------------
==>重排结果<==
--------------------------------------------------------------
[root@web01 ~]# sort testfile
Hello 95
Linux 85
test 30
2. uniq:去除重复行
uniq命令的功能说明
uniq命令用于检查及删除文本文件中重复出现的行列,一般与sort命令结合使用。uniq可检查文本文件中重复出现的行列。
uniq命令的语法格式
uniq[OPTION]... [INPUT [OUTPUT]]
uniq[-cdu][-f][-s][-w][--help][--version][输入文件][输出文件]
uniq命令的常用参数说明:
uniq参数不多,表1为uniq命令的参数及说明:
表1:
uniq命令的参数及说明
| 参数选项 | 解释说明 |
|---|---|
| -c或--count | 在每列旁边显示该行重复出现的次数。 |
| -d或--repeated | 仅显示重复出现的行列。 |
| -f或--skip-fields= | 忽略比较指定的栏位。 |
| -s或--skip-chars= | 忽略比较指定的字符。 |
| -u或--unique | 仅显示出一次的行列。 |
| -w或--check-chars= | 指定要比较的字符。 |
| --help | 显示帮助。 |
| --version | 显示版本信息。 |
| [输入文件] | 指定已排序好的文本文件。如果不指定此项,则从标准读取数据; |
| [输出文件] | 指定输出的文件。如果不指定此选项,则将内容显示到标准输出设备(显示终端)。 |
uniq命令的实践操作
范例1: 文件testfile中第 2、3、5、6、7、9行为相同的行,使用
uniq命令删除重复的行,可使用以下命令:
--------------------------------------------------------------
==>原有内容 <==
--------------------------------------------------------------
[root@web01 ~]# cat testfile
test 30
test 30
test 30
Hello 95
Hello 95
Hello 95
Hello 95
Linux 85
Linux 85
--------------------------------------------------------------
==>删除重复行后的内容<==
--------------------------------------------------------------
[root@web01 ~]# uniq testfile
test 30
Hello 95
Linux 85
范例2: 检查文件并删除文件中重复出现的行,并在行首显示该行重复出现的次数。使用如下命令:
[root@web01 ~]# uniq -c testfile <-->删除重复行后的内容
3 test 30 <-->前面的数字的意义为该行共出现了3次
4 Hello 95 <-->前面的数字的意义为该行共出现了4次
2 Linux 85 <-->前面的数字的意义为该行共出现了2次
范例3: 当重复的行并不相邻时,
uniq命令是不起作用的,即若文件内容为以下时,uniq命令不起作用:
--------------------------------------------------------------
==>原有内容 <==
--------------------------------------------------------------
[root@web01 ~]# cat testfile1
test 30
Hello 95
Linux 85
test 30
Hello 95
Linux 85
test 30
Hello 95
Linux 85
--------------------------------------------------------------
==>这时我们就可以使用 sort<==
--------------------------------------------------------------
[root@web01 ~]# sort testfile1 | uniq
Hello 95
Linux 85
test 30
--------------------------------------------------------------
==>统计各行在文件中出现的次数:<==
--------------------------------------------------------------
[root@web01 ~]# sort testfile1 | uniq -c
3 Hello 95
3 Linux 85
3 test 30
--------------------------------------------------------------
==>在文件中找出重复的行:<==
--------------------------------------------------------------
[root@web01 ~]# sort testfile1 | uniq -d
Hello 95
Linux 85
test 30
今天就写到这里,有什么疑问或出现什么错误,随时欢迎大神们发表评论指点迷津
Shell命令-文件及内容处理之sort、uniq的更多相关文章
- Shell命令-文件及内容处理之more、less
文件及内容处理 - more.less 1. more:分页显示文件内容 more命令的功能说明 more 命令类似 cat,不过会以一页一页的形式显示,更方便使用者逐页阅读,而最基本的指令就是按空白 ...
- Shell命令-文件及内容处理之cat、tac
文件及内容处理 - cat.tac 1. cat:显示文件内容 cat命令的功能说明 cat命令用于连接多个文件并且打印到屏幕输出或重定向到指定文件中 cat命令的语法格式 cat [OPTION]. ...
- Shell命令-文件及内容处理之head、tail
文件及内容处理 - head.tail 1. head:显示文件内容头部 head命令的功能说明 head 命令用于显示文件头部内容,默认执行 head 命令会输出文件开头的 10 行. head命令 ...
- Shell命令-文件及内容处理之cut、rev
文件及内容处理 - cut.rev 1. cut:切割文件内容 cut命令的功能说明 cut 命令用于显示每行从开头算起num1 到 num2 的文字. cut命令的语法格式 cut [OPTION] ...
- Shell命令-文件及内容处理之diff、vimdiff
文件及内容处理 - diff.vimdiff 1. diff:比较两个文件区别 diff命令的功能说明 diff命令用比较文件的差异.diff以逐行的方式,比较文本文件的异同处.如果指定要比较目录,则 ...
- Shell命令-文件及内容处理之wc,tr
文件及内容处理 - wc.tr 1. wc:统计文件的行数.单词数或字节数 wc命令的功能说明 wc 命令用于计算字数.利用 wc 指令我们可以计算文件的字节数,字数,或是列数,若不指定文件名称,或是 ...
- Shell命令-文件及内容处理之vi、vim
文件及内容处理 - vi.vim 1.Linux vi/vim 所有的 Unix Like 系统都会内建 vi 文书编辑器,其他的文书编辑器则不一定会存在. 但是目前我们使用比较多的是 vim 编辑器 ...
- Shell命令-文件及内容处理之grep(egrep)、join
文件及内容处理 - grep(egrep).join 1. grep(egrep):文本过滤工具 grep(egrep)命令的功能说明 grep命令是Linux系统中最重要的命令之一,其功能是从文本文 ...
- Shell命令-文件及内容处理之split、paste
文件及内容处理 - split.paste 1. split:分割文件为不同的小片段 split命令的功能说明 split 命令用于将一个文件分割成数个.该指令将大文件分割成较小的文件,在默认情况下将 ...
随机推荐
- Java开发笔记(二十六)方法的输出参数
前面介绍了方法的输入参数,与输入参数相对应的则为输出参数,输出参数也被称作方法的返回值,意思是经过方法的处理最终得到的运算数值.这个返回值可能是整型数,也可能是双精度数,也可能是数组等其它类型,甚至允 ...
- Java开发笔记(六十三)双冒号标记的方法引用
前面介绍了如何自己定义函数式接口,本文接续函数式接口的实现原理,阐述它在数组处理中的实际应用.数组工具Arrays提供了sort方法用于数组元素排序,可是并未提供更丰富的数组加工操作,比如从某个字符串 ...
- 程序员50题(JS版本)(四)
程序16:求s=a+aa+aaa+aaaa+aa...a的值,其中a是一个数字.例如2+22+222+2222+22222(此时共有5个数相加),几个数相加有键盘控制 var s=0; var num ...
- 【代码笔记】Web-CSS-CSS Text(文本)
一,效果图. 二,代码. <!DOCTYPE html> <html> <head> <meta charset="utf-8"> ...
- H5的语义化标签(PS: 后续继续补充)
头部信息 <header></header> 区块标签 <figure> <figcaption>123</figcaption> < ...
- 用WijmoJS搭建您的前端Web应用 —— React
前文回顾 在本系列文章中,我们已经介绍了Angular和Vue框架下 WijmoJS 的玩法. 而今天,我们将展示如何使用 WijmoJS 来搭建一款具备独特创新性.出色性能和简单代码逻辑的 Reac ...
- 【自动化测试&爬虫系列】Selenium Webdriver
文章来源:公众号-智能化IT系统. 一. Selenium Webdriver技术介绍 1. 简介 selenium Webdriver是一套针对不同浏览器而开发的web应用自动化测试代码库.使用这套 ...
- 【原】Java学习笔记018 - 面向对象
package cn.temptation; public class Sample01 { public static void main(String[] args) { // 继承关系的子类可以 ...
- c/c++ linux 进程间通信系列1,使用signal,kill
linux 进程间通信系列1,使用signal,kill 信号基本概念: 软中断信号(signal,又简称为信号)用来通知进程发生了异步事件.进程之间可以互相通过系统调用kill发送软中断信号.内核 ...
- 我的第一个python web开发框架(24)——系统重构与ORM
小白弄完代码版本管理和接口文档后,兴奋的找到老菜. 小白:老大,我已经按你讲的要求,将代码版本管理和接口文档都搞好了.从项目开始到现在,除了代码编写,感觉学会好多东西啊. 老菜:嗯嗯,实战确实需要掌握 ...