uniq - report or omit repeated lines 省去重复的行 参数: -i 忽略大小写字符的不同 -c 对重复的行进行记数 注意:uniq命令只会对相邻的重复的行进行去重,所以uniq常常和sort命令一起用,sort命令可将重复的行排在一起,然后使用uniq进行重复数统计 [root@BASE test]# cat c.txt a a b a a a b b b d b [root@BASE test]# cat c.txt |uniq a b a b d b…
Basic Text Analysis with Command Line Tools in Linux | William J Turkel 这篇文章非常清楚的介绍了如何使用Linux的命令行工具进行文本分析,统计一本书中每个词出现的频率. 使用了如下的命令: wget file head tail cp ls less sed wc grep tr sort uniq 对于Windows用户,可以通过cygwin在Windows下安装linux的这些强大的命令.…