[转帖]awk命令 去掉重复行】的更多相关文章

文本处理时,经常要删除重复行,下面是三种方法 第一,用sort+uniq,注意,单纯uniq是不行的. sort -n test.txt | uniq 第二,用sort+awk命令,注意,单纯awk同样不行,原因同上. sort -n $file | awk '{if($0!=line)print; line=$0}' 第三,用sort+sed命令,同样需要sort命令先排序. sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D' Shell脚本 view…
获取/etc/passwd目录下的UID值小于10的数,并输出第一.三列 [root@:vg_adn_tidbCkhsTest:172.31.30.62 ~]#cat /etc/passwd | awk 'BEGIN {FS=":"} $3 < 10 {print $1 "\t" $3}' root bin daemon adm lp sync halt mail…
首先解释一下什么叫“按域去除重复行”: 有的时候我们需要去除的重复行并不是整行都重复,两行的其中一列的元素相同我们有的时候就需要认定这两行重复,因此有了今天的内容. 去除重复行shell有一个原生命令但是不太好使应为这个命令找的重复行是上下文的重复行,也就是说需要提前排序,这样就增加了不必要的麻烦,我们在这里选择使用awk工具进行重复行的去除. 命令如下: awk '!array[$0]++' Filename 解释一下这行代码,由于awk工作方式的特殊性,也就是按行读入按行输出,中间引号内的语…
本文部分翻译自这里,来自 Jadu Saikia 的博客,这个博客上有很多非常有用的小技巧,有空可以多看看. 通常如果我们想获取一个文件里不重复的行的时候,我们可以直接通过 sort -u 命令,先把文件排序,然后去掉连续的重复行就行. 可是,如果我们去掉重复行之后,还想保留文件原有的顺序,该怎么办呢?虽然 Linux 下有个看上去似乎很有用的命令叫uniq,但事实上 uniq 命令仅仅只对连续的重复行有效.譬如我们有这样一个文件: $ cat file3AAAAFFFFBBBBBBBBCCCC…
简介 awk是一个强大的文本分析工具,尤其是在应对格式化比较好的日志文件时,简单来说awk就是把文件逐行的读入,以空格为默认分隔符(也可以指定分隔符)将每行切片处理. 语法 awk [选项参数] 'script' var=value file(s) 或 awk [选项参数] -f scriptfile var=value file(s) awk的工作流程 awk工作流程是这样的:读入有'\n'换行符分割的一条记录,然后将记录按指定的域分隔符划分域,填充域,$0则表示所有域也就是整条记录(这和正则…
网上有很多方法,比如利用视图处理: //去掉重复行 DataView dv = table.DefaultView; table = dv.ToTable(true, new string[] { "name", "code" }); 此时table 就只有name.code无重复的两行了,如果还需要id值则 table = dv.ToTable(true, new string[] { "id","name", "…
Linux合并文件命令: awk '{printf("%s\n",$0)}' YQ-*101?.txt >  123.txt   linux去除重复行命令:cat YQ-101.txt | sort | uniq > YQ-uniq-101.txt …
[root@localhost ~]#cat 0712 YRSD2-1-11 YRSD2-2-18 YRSD1-1-8 YRSD1-1-18 YRSD1-1-20 YRSD1-1-25 YRSD1-2-38 YRSD1-2-39 YRSD1-2-44 YRSD1-2-48 YRSD1-2-43 YRSD1-3-58 YRSD1-3-59 YRSD1-4-67 YRSD1-4-68 YRSD1-4-70 YRSD1-4-71 YRSD1-3-52 YRSD4-1-5 YRSD3-1-7 YRSD3…
Linux下对文件进行按行排序:sort 与 uniq 命令简介 Linux | May 24, 2015 | linux sort 命令可针对文本文件的内容,以行为单位进行排序.其基本语法格式为: sort [-bcfMnrtk][源文件][-o 输出文件] 参数: -b 忽略每行前面开始出的空格字符. -c 检查文件是否已经按照顺序排序. -f 排序时,忽略大小写字母. -M 将前面3个字母依照月份的缩写进行排序. -n 依照数值的大小排序. -o<输出文件> 将排序后的结果存入指定的文件…
$ cat file liw liw liw hdsui mdksjd liw $ cat file | uniq -u # 只删除相邻的,不保留重复行 hdsui mdksjd liw $ cat file | awk '!a[$1]++' # 不用排序,保留重复行中的一行 liw hdsui mdksjd…