Linux命令sort和uniq 的基本使用】的更多相关文章

sort uniq sort:对行或者文本文件排序 uniq:去除重复的行 常用 sort -n file.txt 按数字进行排序 sort -r file.txt 按逆序进行排序 sort -M file.txt 按月份进行排序 sort -C file 如果返回0表示已经排序 sort -nC file 返回0表示已经按照数字排序 sort -m sorted_file1 sorted_file2 合并两个已经排过序的文件,而且不需要对合并后的文件再次排序 按键或者列进行排序 sort -n…
uniq 123.txt  去除连续重复uniq -u 123.txt  保留唯一uniq -c 123.txt  去重并计算出现的个数sort -n 123.txt | uniq -c 排序后去重sort -u 排序去重复…
文本处理命令 1.sort命令 使用场景 : 用于将文件内容加以排序(可以和cat一起用) 参数 作用 -n 依照数值的大小排序 -r 以相反的顺序来排序(默认只比较第一个数,-rn是按所有数值比较) -k 以某列进行排序 -t 指定分割符,默认是以空格为分隔符 补充: 在vim编辑文本里 末行模式…
相信在Linux下对文件操作经常会用到sort和uniq命令,下面系统的介绍一下这两个命令的用法. sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出.sort命令既可以从特定的文件,也可以从stdin中获取输入. 语法 sort(选项)(参数) 选项 -b:忽略每行前面开始出的空格字符: -c:检查文件是否已经按照顺序排序: -d:排序时,处理英文字母.数字及空格字符外,忽略其他的字符: -f:排序时,将小写字母视为大写字母: -i:排序时,除了040至176之间的A…
#文本处理命令--sort,cut,wc及其他 文本处理命令还有其他常用的,比如:sort,cut,wc 1.cut命令的用法 cut命令: cut - remove sections from each line of files cut OPTION... [FILE]... -c:字符范围,用于排列整齐的信息 -d CHAR:以指定的字符为输入分隔符:默认为空白字符: -f FILEDS:挑选出的字段: #:指定的单个字段: #,#:离散的多个字段:例如1,3,7: #-#:连续的多个字段…
uniq uniq命令: uniq不加参数,只对相邻的相同行内容去重. 例子如下: [root@localhost ~]# pwd /root [root@localhost ~]# cat oldboy.txt 10.0.0.9 10.0.0.8 10.0.0.7 10.0.0.7 10.0.0.8 10.0.0.8 10.0.0.9 [root@localhost ~]# uniq oldboy.txt 10.0.0.9 10.0.0.8 10.0.0.7 10.0.0.8 10.0.0.9…
命令难度总体来说有简入难,参数都是工作中常常用到的.如果涉及到一些生僻的参数还请百度或man一下. sort(参考学习网站:http://www.cnblogs.com/dong008259/archive/2011/12/08/2281214.html) 功能:根据不同的数据类型进行排序 格式:sort [-cMnrtk][源文件][-o 输出文件] 说明: 如果有一个文件"1.txt",假如有一列数字,分别为1,2,2,3,5,4 -n:   依照数值的大小排序 --> 数字…
sort [-fbMnrtuk] [file or stdin] 选项与参数: -f :忽略大小写的差异,例如 A 与 a 视为编码相同: -b :忽略最前面的空格符部分: -M :以月份的名字来排序,例如 JAN, DEC 等等的排序方法: -n :使用『纯数字』进行排序(默认是以文字型态来排序的): -r :反向排序: -u :就是 uniq ,相同的数据中,仅出现一行代表: -t :分隔符,默认是用 [tab] 键来分隔: -k :以那个区间 (field) 来进行排序的意思 sort -…
sort(参考学习网站:http://www.cnblogs.com/dong008259/archive/2011/12/08/2281214.html) 功能:根据不同的数据类型进行排序 格式:sort [-cMnrtk][源文件][-o 输出文件] 说明: 如果有一个文件"1.txt",假如有一列数字,分别为1,2,2,3,5,4 -n:   依照数值的大小排序 --> 数字以字符进行排序时,2比10大    cat 1.txt |  sort -n -u: 在输出行中去除…
笔记 1.晨考 1.写出过滤手机号的正则表达式 1[0-9]{10} 2.写出过滤邮箱的正则表达式 chenyang@123.com [a-zA-Z0-9-_]+@[a-z0-9]+\.(com|cn|com\.cn|net) 3.过滤密码,要求必须要大写字母.小写字母.数字以及下划线,长度在 8 到 16 之间 ([A-Z]+[a-z]+[0-9]+_+){8,16} 4.过滤本地的IP ip a | grep -E '([(1[0-9]{2}){3}(2[0-4][0-9]){3}(25[0…
参考 linux sort 命令详解 http://www.cnblogs.com/51linux/archive/2012/05/23/2515299.html 1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出(默认). [rocrocket@rocrocket programming]$ cat seq.txtbananaapplepearorange[rocrocket@rocrocket pr…
Linux下的sort排序命令详解(一) 1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出. [zookeeper@master rh]$ cat seq.txt banana apple pear orange pear [zookeeper@master rh]$ sort seq.txt apple banana orange pear pear 2 sort的-u选项 它的作用很简单,就是在输…
命令格式 sort [OPTION]... [FILE]... 命令参数 -b, --ignore-leading-blanks 忽略开头的空白字符. -d, --dictionary-order 只考虑空白字符.字母和数字字符. -f, --ignore-case 排序时不区分大小写. -g, --general-numeric-sort 根据常规数值排序. -i, --ignore-nonprinting 只考虑可打印的字符. -M, --month-sort 根据月份排序, JAN < .…
实例cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100 统计文件中出现次数最多的前10个单词 使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词. cat words.txt | sort | uniq -c | sort -k1,1nr | head -10 主要考察对sort.uniq命令…
目录 管道符号 " | " grep sed awk sort comm uniq tr cat head tail wc find tsort tee 「>」重定向符号 「<」重定向符号 混淆 Unicode 结果 直接从数据库管道 总结 @ 本文将为读者提供许多不同 Linux 命令的简要概述. 将特别强调解释如何在执行数据科学任务的上下文中使用每个命令. 我们的目标是让读者相信这些命令中的每一个都非常有用,并且让他们了解每个命令在操作或分析数据时可以扮演什么角色. 管…
今天介绍几个我常用的Linux 命令,每个命令这里只介绍其常用参数. 对于每个Linux 命令都可以使用man + 命令名称,查看其完整使用方法. 0,man man 命令是一个非常有用的命令,当你不会使用某个Linux 命令时,可以使用man 来查看其帮助文档.man 命令查到的手册来源于目录 /usr/share/man/,可以看到该目录下有9 个这样的目录: >>> ls /usr/share/man/| grep man _____________________________…
最近好懒好懒.连写文章都写不好了.于是只能写读一点书,记一点读书笔记了.太懒了,没办法.慢慢恢复自己的状态吧. 管道命令仅会处理strandard output 的内容,对于strandard error output会予以忽略. 管道明亮必须要能够接受来自前一个命令的数据成为standard input 继续处理. 选取命令cut , grep 下面是cut 的一些参数.执行cut --help 可以得到中文的帮助信息,要不要太赞啊! 从每个文件中输出指定部分到标准输出. 长选项必须使用的参数…
命令行 管道(Pipelines) 详细解释 本文地址: http://blog.csdn.net/caroline_wendy/article/details/24249529 管道操作符"|", 能够把一个命令的标准输出(stdout), 送到还有一个命令的标准输入(stdin)中. 过滤器(filter), 就是把多条命令合在一起构成一个管道. 主要命令: sort: 排序; uniq, UNIQue, 输出没有反复行的数据; 參数"-d", 能够输出反复行;…
命令行 管道(Pipelines) 具体解释 本文地址: http://blog.csdn.net/caroline_wendy/article/details/24249529 管道操作符"|", 能够把一个命令的标准输出(stdout), 送到还有一个命令的标准输入(stdin)中. 过滤器(filter), 就是把多条命令合在一起构成一个管道. 主要命令: sort: 排序; uniq, UNIQue, 输出没有反复行的数据; 參数"-d", 能够输出反复行;…
一.校验与核实 目前最为出名的校验技术是md5sum和sha1sum,它们对文件内容使用相应的算法来生成校验和. 举例: amosli@amosli-pc:~/learn$ md5sum text.txt 186931e2ff7cb0cde2c17b2298be604c text.txt 如上所示,使用md5sum生成了一个由32个字符组成的十六进制串. 可以将输出的校验重定向到一个文件中,然后再用这个md5文件来核实数据的完整性: amosli@amosli-pc:~/learn$ md5su…
sort sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出.如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行排序. sort语法 [root@www ~]# sort [-fbMnrtuk] [file or stdin] 选项与参数: -f :忽略大小写的差异,例如 A 与 a 视为编码相同: -b :忽略最前面的空格符部分: -M :以月份的名字来排序,例如 JAN, DEC 等等的排序方法: -n :使用『纯数字』进行排…
tail 命令从指定点开始将文件写到标准输出.使用tail命令的-f选项可以方便的查阅正在改变的日志文件,tail -f filename会把filename里最尾部的内容显示在屏幕上,并且不但刷新,使你看到最新的文件内容. 1.命令格式; tail[必要参数][选择参数][文件] 2.命令功能: 用于显示指定文件末尾内容,不指定文件时,作为输入信息进行处理.常用查看日志文件. 3.命令参数: -f 循环读取 -q 不显示处理信息 -v 显示详细的处理信息 -c<数目> 显示的字节数 -n&l…
1.awk awk是行处理器: 相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或是处理缓慢的问题,通常用来格式化文本信息 $ 表示当前行 $ 表示第一列 NF 表示一共有多少列 $NF 表示最后一列 $(NF-) 表示倒数第二列 打印倒数第三列: cat file.txt | grep eop.mall..com | awk '{print $(NF-3)}' 加入倒数第三列格式为cost=100.123,要筛选出cost大于100的列: cat ral-worker.log | gre…
sort: 选项: -b 忽略每行前面开始出的空格字符 -c 检查文件是否已经按照顺序排序 -d 排序时,处理英文字母.数字及空格字符外,忽略其他的字符 -f 排序时,将小写字母视为大写字母 -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符 -m 将几个排序好的文件进行合并 -M 将前面3个字母依照月份的缩写进行排序 -n 依照数值的大小排序 -o 将排序后的结果存入指定的文件 -r 倒序 -t 指定排序时所用的分隔符, 默认为[tab](通常和 -k 参数一起使用) -k…
以文件的每行为单位,从左往右依次按ascii码进行比较 sort sort.txt #默认为升序 -u:去除重复行 sort -u sort.txt -r:降序排列 sort -r sort.txt -o:重定向到源文件 sort -r -o sort.txt -n:以数字的真实值比价大小,如果不加则会出现 排在 前面的情况 sort -n sort.txt -t:分隔符 -k:位置 sort.txt #以冒号进行分割,然后取第二列进行数字比较 uniq只对相连的行进行处理,所以操作前必须先so…
转载地址:http://blog.51yip.com/shell/1022.html 实例详细说明linux下去除重复行命令uniq 一,uniq干什么用的 文本中的重复行,基本上不是我们所要的,所以就要去除掉.linux下有其他命令可以去除重复行,但是我觉得uniq还是比较方便的一个.使用uniq的时候要注意以下二点 1,对文本操作时,它一般会和sort命令进行组合使用,因为uniq 不会检查重复的行,除非它们是相邻的行.如果您想先对输入排序,使用sort -u. 2,对文本操作时,若域中为先…
文件及内容处理 - sort.unip 1. sort:对文件的文本内容排序 sort命令的功能说明 sort 命令用于将文本文件内容加以排序.sort 可针对文本文件的内容,以行为单位来排序. sort命令的语法格式 sort [OPTION]... [FILE]... sort [-bcdfimMnr][-o][-t][+-][--help][--verison][文件] sort命令的常用参数说明: split 参数很多,表1为 sort 命令的参数及说明: 表1: sort 命令的参数及…
1.sort的作用 (排序) sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出. 如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行排序. 2. sort语法 sort [-fbMnrtuk] [file or stdin]选项与参数:-f :忽略大小写的差异,例如 A 与 a 视为编码相同:-b :忽略最前面的空格符部分:-M :以月份的名字来排序,例如 JAN, DEC 等等的排序方法:-n :使用『纯数字』进行排序(默认是…
centos shell基础知识 alias  变量单引号 双引号   history 错误重定向 2>&1  jobs  环境变量 .bash_history  source配置文件  nohup & 后台运行 cut,sort,wc ,uniq ,tee ,tr ,split, paste cat> 2.txt <<EOF 通配符 glob模式  发邮件命令mail 2015-4-8 第十二节课 set unset export 上半节课 history:命令历…
linux命令uniq去重 实例详细说明linux下去除重复行命令uniq 一,uniq干什么用的 文本中的重复行,基本上不是我们所要的,所以就要去除掉.linux下有其他命令可以去除重复行,但是我觉得uniq还是比较方便的一个.使用uniq的时候要注意以下二点 1,对文本操作时,它一般会和sort命令进行组合使用,因为uniq 不会检查重复的行,除非它们是相邻的行.如果您想先对输入排序,使用sort -u. 2,对文本操作时,若域中为先空字符(通常包括空格以及制表符),然后非空字符,域中字符前…