排序命令sort

Unix和Linux自带的sort命令功能非常强大，其主要功能是对文本内容按不同的方法排序。它不仅可以按一个或多个字段排序，还可以合并文件。使用sort处理一些较大的文件时，可能处理速度会比较慢，但却非常有效。

命令格式：

sort [option] [file]

sort处理的文本可以来自一个文本文件，也可以来自标准输入和管道等。

常用选项：

b：按字典顺序进行排序，忽略前面的空格或制表符。

d：按字典顺序进行排序，将除空格和字母以外的字符排除。

f：忽略大小写。

g：根据数值进行排序，默认从小到大（可以配合r使用按数值从大到小排序）。

i：只考虑可打印的字符。

M：将字符按月份进行比较，例如JAN<…<DEC。

n：按数值进行比较排序，默认从小到大（可以配合r使用按数值从大到小）。

r：反向排序（按首个数字从大到小，而不是按数值从大到小，字母按逆序）。

c：测试文件内容是否已经进行了排序，若无任何返回信息，则表示已经执行了排序操作。

k：指定排序的关键字。

m：合并已经排序的文件，不进行排序。

o：将结果写入文件内，不再输出到标准输出。

s：通过屏蔽最后的分类进行稳定排序。

t：使用指定的字符作为字段分隔符。

T：将临时文件放入指定的目录内。

u：如果与选项c一起使用，则检查是否在排序时已经去除重复的行，没有选项c时，则在排序时去掉重复的行。

z：用一个0字节作为结束，而不是一个换行符。

默认情况下，sort同awk一样，使用空格或制表符Tab来分割字段。如果要排序的文件不是以空格或制表符作为字段分隔符，应该使用t选项指定分隔符。分割后就可以按字段进行排序了。排序既可以按某个字段进行排序，也可以按整行排序。

用法示例：

（1）在使用sort命令对文本进行排序时，sort默认会将排序结果输出到标准输出。如果要保存到文件，可以使用重定向或选项o。例如：

[root@localhost test]# cat students

 Liulu        Sichuan Lixia   //

 Liumin       Henan   lixia   //

 Xuli         Jiangsu Luolei  //

 Xiayu        Shanxi  Hetao   //

 Liwei        Sichuan tangwei //

 Heli         Xizang  Tangwei //

 Wangtao      Yunnan  Huli    //

[root@localhost test]# sort students >students_sort

[root@localhost test]# cat students_sort

 Liwei        Sichuan tangwei //

 Xuli         Jiangsu Luolei  //

 Wangtao      Yunnan  Huli    //

 Liumin       Henan   lixia   //

 Liulu        Sichuan Lixia   //

 Xiayu        Shanxi  Hetao   //

 Heli         Xizang  Tangwei //

[root@localhost test]# sort -o students_sort students

使用o选项保存结果时，如果指定的保存位置和输入的文件是同一个文件，sort会将结果保存在临时文件内，等排序结束才将结果写入。

提示：应尽量避免将输出保存到输入的文件中，特别是对一些较长的文件进行操作时，意外的错误可能会导致数据丢失。

（2）在对文件进行合并、连接之前，应该先检查文件是否已经执行了排序。可以使用c选项检测文件是否已经进行了排序。例如：

[root@localhost test]# sort -c students_sort

[root@localhost test]# sort -c students

sort: students:: disorder:  Liumin   Henan   lixia   //

如果文件已经排序，sort将不会返回任何结果。若没有排序，则返回相关提示信息。

（3）有时文件的行前面可能会出现一些特别的字符，影响排序的结果。这时查看文件内容并结合使用选项b和d可以排除这些字符的干扰。例如：

[root@localhost test]# cat name1

Tom

        Jiim

Lili

        Kate

[root@localhost test]# sort -b name1

        Jiim

        Kate

Lili

Tom

[root@localhost test]# cat name2

Tom

        %Kate

Marry

        #Lili

[root@localhost test]# sort -d name2

        %Kate

        #Lili

Marry

Tom

（4）在某些系统中，sort排序会对大写字母和小写字母区别对待。这时为了避免手动输入时产生的失误，需要将小写字母和大写字母同等对待，可以使用f选项，例如：

[root@localhost test]# sort -f alph

a

b

C

D

e

（5）默认情况下，sort总是先看第1行的第1个字符，如果第1个字符相同，则比较第2个字符，依次类推。但是有数字出现的情况则不同，默认情况下，数字1会排在数字2的前面：

[root@localhost test]# sort num

如果统计数字，可能用户更希望sort按数值从小到大排序，此时应该使用选项g让sort按数值从小到大进行排序：

[root@localhost test]# sort -g num

（6）有时为了统计一些数据，需要按月份进行排序，比如一个含义销售数据的文本，需要按月份统计销量或金额，此时可以配合使用选项M：

[root@localhost test]# sort -M sales

Jan

Feb

Mar

Apr

May

Jun

（7）可以使用选项r进行反向排序（字母或数字从大到小的顺序）：

[root@localhost test]# sort -r alph

e

D

C

b

a

[root@localhost test]# sort -r num

都是针对首字母、首位数字而言。

（8）通常，sort都使用第1个域作为排序的关键序。然而有时我们关心的内容不在第1个字段，这时就要用到选项k对指定域排序。

例如在students中按学生的辅导员进行排序：

[root@localhost test]# sort -k4 students

 Xiayu        Shanxi  Hetao   //

 Wangtao      Yunnan  Huli    //

 Liulu        Sichuan Lixia   //

...

（9）有时可能对排序的要求更严格，一个典型的例子是某个字段中一个或多个字符指明了产品的产地。这时可以先用一个数字确定要排序的关键域，然后用点号“.”加域中的第几个字符指定排序关键字符。

例如在学生信息文件students中，按学生出生的年份进行排序，出生日期在文本的第5个字段，而年份在第5个字段的第8个字符。因此可以使用一下命令：

[root@localhost test]# sort -k5. students

 Xuli         Jiangsu Luolei  //

 Liwei        Sichuan tangwei //

 Xiayu        Shanxi  Hetao   //

 Wangtao      Yunnan  Huli    //

 Liulu        Sichuan Lixia   //

 Heli         Xizang  Tangwei //

 Liumin       Henan   lixia   //

（10）将文本students中学生信息按总成绩从小到大排序：

[root@localhost test]# sort -k10n students

 Heli         Xizang  Tangwei //

 Liumin       Henan   lixia   //

 Wangtao      Yunnan  Huli    //

 Xuli         Jiangsu Luolei  //

 Liulu        Sichuan Lixia   //

 Xiayu        Shanxi  Hetao   //

 Liwei        Sichuan tangwei //

[root@localhost test]# sort -k10g students

 Heli         Xizang  Tangwei //

 Liumin       Henan   lixia   //

 Wangtao      Yunnan  Huli    //

 Xuli         Jiangsu Luolei  //

 Liulu        Sichuan Lixia   //

 Xiayu        Shanxi  Hetao   //

 Liwei        Sichuan tangwei //

如果要从大到小排序，可以用n或g配合反向r使用：

[root@localhost test]# sort -k10nr students

 Liwei        Sichuan tangwei //

 Xiayu        Shanxi  Hetao   //

 Liulu        Sichuan Lixia   //

 Xuli         Jiangsu Luolei  //

 Wangtao      Yunnan  Huli    //

 Liumin       Henan   lixia   //

 Heli         Xizang  Tangwei //

[root@localhost test]# sort -k10gr students

 Liwei        Sichuan tangwei //

 Xiayu        Shanxi  Hetao   //

 Liulu        Sichuan Lixia   //

 Xuli         Jiangsu Luolei  //

 Wangtao      Yunnan  Huli    //

 Liumin       Henan   lixia   //

 Heli         Xizang  Tangwei //

（11）在使用选项k时，也可以指定多个字段排序，方法是使用逗号“，”将多个字段分开，也可以使用多个选项k指定字段。

（先按前面指定的字段排序，若相同，再按总后面字段排序）：

[root@localhost test]# sort -k ,2n test

等价命令：

[root@localhost test]# sort -k 1n -k 2n test

（12）有时要处理的文本并不是以空格或制表符作为字段分隔符，这时应该使用选项t指定分隔符排序，例如：

[root@localhost test]# sort -t# -k3 test

###

###

###

###

（13）当一个文本有一个或多个重复的行时，可以使用u检查或去除重复的行。

[root@localhost test]# sort test >test1

[root@localhost test]# cat test1

How are you?

I am fine, thank you.

I am fine, thank you.

I am fine, thank you.

I am fine, thank you.

Nice to meet you.

Nice to meet you.

Nice to meet you.

[root@localhost test]# sort -c test1

#没有任何返回，说明已经排序

[root@localhost test]# sort -cu test1

sort: test1:: disorder: I am fine, thank you.

#虽然已经经过排序，但有重复行

#删除重复行

[root@localhost test]# sort -u test1

How are you?

I am fine, thank you.

Nice to meet you.

（15）可以使用选项u和f在删除重复行时忽略大小写：

[root@localhost test]# cat test1

How are you?

i am fine.

i am fine.

i am fine.

I AM FINE.

I AM FINE.

I AM FINE.

[root@localhost test]# sort -uf test1

How are you?

i am fine.

（16）sort命令还可以合并文本，但通常推荐合并的多个文本应该具有相似的结构，以便于合并后阅读和使用。例如：

[root@localhost test]# cat test3

aaa

bbb

ccc

zzz

[root@localhost test]# cat test4

ddd

fff

jjj

[root@localhost test]# sort -m test3 test4 >test5

[root@localhost test]# cat test5

aaa

bbb

ccc

ddd

fff

jjj

zzz

在上面的示例中，test3和test4已经过排序，sort先将两个文件合并，然后执行排序并将结果重定向到test5.

注意：在对文件执行合并操作之前，应该先对要合并的文件排序。

（17）管理和维护系统时，为了更为直观地查看命令输出信息，也经常用到sort命令对其他命令的输出排序。例如查看/etc目录中最大的5个文件：

[root@localhost test]# ls -l /etc | awk '{print $1,$5,$9}' | sort -n -k2 | tail -

-rw-r--r--  fb.modes

-rw-r--r--  jwhois.conf

-rw-r--r--  ld.so.cache

-rw-r--r--  services

-rw-r--r--  termcap

注意：sort命令在不同的系统上运行，产生的结果可能会有差异。

排序命令sort的更多相关文章

【Linux】排序命令sort
很多时候,我们都会去计算一次数据里头的相同型态的数据总数,举例来说, 使用 last 可以查得这个月份有登陆主机者的身份.那么我可以针对每个使用者查出他们的总登陆次数吗? 此时就得要排序与计算之类的命 ...
Linux排序命令sort（转）
Linux sort命令用于将文本文件内容加以排序.sort可针对文本文件的内容,以行为单位来排序. 语法 sort [-bcdfimMnr][-o<输出文件>][-t<分隔字符&g ...
Linux排序命令sort详解
语法格式sort [ -A ] [ -b ] [ -c ] [ -d ] [ -f ] [ -i ] [ -m] [ -n ] [ -r ] [ -u ] [ -o OutFile ][ -t Cha ...
linux 排序命令sort
sort [选项] [文件] 选项: -b:忽略每行前面开始出的空格字符: -c:检查文件是否已经按照顺序排序: -d:排序时,处理英文字母.数字及空格字符外,忽略其他的字符: -f:排序时,将小写字 ...
linux常用命令 sort排序命令
排序命令sort sort [选项] 文件名选项 -f 忽略大小写 -n 以数值型进行排序,默认使用字符串型进行排序 -r 反向排序 -t 指定分割符,默认的分割符是制表符 -k n[,m] 安装自 ...
【Linux】排序命令uniq
很多时候,我们都会去计算一次数据里头的相同型态的数据总数,举例来说, 使用 last 可以查得这个月份有登陆主机者的身份.那么我可以针对每个使用者查出他们的总登陆次数吗? 此时就得要排序与计算之类的命 ...
2.sort 排序命令讲解
sort命令 sort:文本排序,仅仅是对显示文件的排序,而不影响源文件的顺序,是根据ASSII码的字符升序来排列的. -n:安装数值大小从小到大排列 ,默认是升序. ...
linux下sort命令使用详解---linux将文本文件内容加以排序命令
转载自:http://www.cnblogs.com/hitwtx/archive/2011/12/03/2274592.html linux下sort命令使用详解---linux将文本文件内容加以排 ...
【转载】Redis sort 排序命令详解
转载地址:http://www.jb51.net/article/69131.htm 本文介绍redis排序命令 redis支持对list,set,sorted set元素的排序 sort 排序命令格 ...

随机推荐

debian7下部署nginx服务器
笔者是在vmware中的Debian7下部署nginx服务器,采用离线部署方式.过程如下: 1.准备好需要的离线安装包 nginx-1.6.2.tar.gz,pcre-8.34.tar.gz,open ...
Java执行groovy脚本
Binding binding = new Binding(); binding.setVariable("foo", new Integer(2)); GroovyShell s ...
URAL-1991 The battle near the swamp 水题
题目链接:http://acm.timus.ru/problem.aspx?space=1&num=1991 水题.. //STATUS:C++_AC_15MS_333KB #include ...
了解shell
1. shell 脚本文件第一行: #!/bin/sh 或 #!/bin/bash "#!" 又称为纪数,在执行bash脚本的时候,内核会根据它来确定该用哪个程序来解释脚本 ...
轻松学习Linux之VI编辑器的使用
本文出自 "李晨光原创技术博客" 博客,谢绝转载!
EF6 在原有数据库中使用 CodeFirst 总复习（五、生成发帖页面）
有点与在原有数据库中使用 CodeFirst 远了,不过是总复习吗,总得全面点. 一.在用户表(Users)中插入两个用户二.生成发帖界面 MVC生成的界面很多,也没使用Ajax,实际开发中很少会使 ...
[原创]Devexpress XtraReports 系列 7 创建Drill-Down(向下钻取)报表
昨天发表了Devexpress XtraReports系列第六篇[原创]Devexpress XtraReports 系列 6 创建并排报表,今天我们继续. 今天的主题是创建Drill-Down报表. ...
POJ 1160Post Office
POJ 1160 Post Office 我不知道优化,我只知道最暴力的方法,O(V^3),居然100ms不到的过了设DP[i][j][k]表示考虑前i个小镇,放了j个邮局,最后一个邮局的所在 ...
HDU 4870Rating（推公式）
有关这个题的高斯消元的方法已经在我的另一篇博客中给出http://www.cnblogs.com/gj-Acit/p/3888382.html 这里介绍一个很吊的解法,复杂度降到了O(n),以下转自h ...
HDU1150Machine Schedule（二分图最大匹配的DFS解法）
题目大意就是说有两台机器,分别有n,m种模式可以调节,有k个工作,某一个工作i可以在第一台机器的a[i]模式下或第二台机器的b[i]模式下工作,两台机器的初始模式为0,问如何分配这K件工作使得两台机器 ...

排序命令sort

排序命令sort的更多相关文章

随机推荐

热门专题