标签(空格分隔): Linux


sort -- 文件内排序命令

sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次比较其ASCII码。

  • 按每行升序排序:
  • sort seq.txt
  • 在输出行中去除重复行:
  • sort -u seq.txt
  • 输出行按降序排序:
  • sort -r seq.txt
  • 将输出结果重定向写入新的文件:
  • sort seq.txt > seq1.txt
  • 将输出结果重定向写入原来文件:
  • sort seq.txt -o seq.txt
  • 输出结果以数值而非ASCII码排序:
  • sort -n seq.txt
  • 按照指定列排序:
  • sort -t ':' -k 2, 2nb seq.txt
  • -t指定分隔符,-k指定按照哪一列排序
  • 如果分隔符为制表符,则使用 -t $'\t'

  • 稳定排序:
  • sort -s seq.txt
  • 合并多个有序文件
  • sort -m seq.txt seq1.txt

uniq

对于连续重复出现的行,只会打印第一行,而不会打印其他重复行。与sort连用。

  • 一般用法:
  • uniq seq.txt
  • 打印出每行重复出现的次数:
  • uniq -c seq.txt
  • 打印出出现多次(大于1次)的行:
  • uniq -d seq.txt
  • 打印不存在重复行的行:
  • uniq -u seq.txt
  • 忽略掉前n个域:(忽略掉前n个域,将第(n+1)以及之后的域当做关键字)
  • uniq -f n seq.txt
  • 忽略掉前n个字符:
  • uniq -s n seq.txt
  • 忽略掉前n个域和前m个字符:
  • uniq -f n -s m seq.txt
  • d最多比较n个字符:
  • uniq -w n seq.txt

cut

cut命令用于打印出一个文件中指定的某几个域,或某几个字符,或某几个字节。

按字节打印

  • 打印每行的第n个字节:
  • cut -b n seq.txt
  • 打印每行的第1-n这个范围的字节:
  • cut -b -n seq.txt
  • 打印每行的第n-最后范围的字节:
  • cut -b n- seq.txt
  • 打印每行的第m-n这个范围的字节:
  • cut -b m-n seq.txt
  • 打印多个范围的字节:
  • cut -b m-n,t-s seq.txt

按字符打印

  • 打印每行的第n个字符:
  • cut -c n seq.txt
    剩下的情况如按字节打印。

按域打印

cut 命令默认以制表符为一个分隔符。如果要自定义分隔符,用-d指定。cut -d '分隔符'

  • 打印每行的第n个域:
  • cut -d '分隔符' -f n seq.txt

paste

paste命令用来将多个文件中的内容并列打印,或横排打印。每行有多个域,每个域对应一个文件中相应行的内容。任意两个域之间默认用一个制表符隔开。如果某一行中,某个文件没有内容,则相应域为一个空串。

  • 一般语法:
  • paste filename1 filename2 filename3
  • 指定分隔符:
  • paste -d '分割符' filename1 filename2 filename3
  • 横排打印:(先打印完一个文件中的所有行到一行中,再打印另外一个文件中的所有行到下一行)
  • paste -s -d '分隔符' filename1 filename2 filename3

split

split命令用来将一个文件按字节或者按行分割成多个小文件。

  • 按字节分割成多个文件:
  • split -b m -a p -d --additional-suffix='额外的后缀字符串' filename output
  • -b指定字节数,可以带单位,如K, M, G, T, P, E, Z, Y;
  • -a指定分割成的子文件的文件名的后缀长度。默认情况下后缀为[a-z]的字符串。
  • -d指定后缀名为数字字符串,比如长度为2的数字字符串后缀为00,01,02...
  • -additional-suffix指定额外的字符串;
  • output 为所分割成的子文件的文件名的前缀。
  • 按行数分割成多个文件:
  • split -l m -a p -d --additional-suffix='额外的字符串' filename output
  • 如:aplit -l 2 -a 2 seq.txt output

cat

将多个文件连接在一起并打印。一个文件连接到前一个文件的尾部。

  • 一般语法:
  • cat filename1 filename2 filename3
  • 显示行号:
  • cat -n filename1 filename2 filename3

join

  • 左连接:
  • join -a 1 -t '分隔符' -1 m -2 n filename1 filename2
  • -a指定文件编号(只能为1或者2)。命令行中第一个文件的编号为1,第二个文件的编号为2.
  • 如果不指定,则表示进行内连接。只会打印出匹配并合并后的行;
  • 如果指定为1,则表示进行左连接
  • 如果指定为2,则表示进行右连接
  • 如果既指定为1,又指定为2,则表示进行全连接。除了会打印出两个文件中匹配并合并后的行外,还会打印出第一个文件和第二个文件中不匹配的行。
  • -1是参数,用于指定需要进行匹配的第一个文件中的域的编号;
  • -2是参数,用于指定需要进行匹配的第二个文件中的域的编号。
  • 在打印合并后的内容的过程中,会先打印匹配的域,然后分别打印第一个文件和第二个文件中的剩余部分
  • 右连接:
  • join -a 2 -t ':' -1 1 -2 1 seq.txt seq1.txt
  • 全连接:
  • join -a 1 -a 2 -t ':' -1 1 -2 1 seq.txt seq1.txt
  • 内连接:
  • join -1 1 -2 1 seq.txt seq1.txt

Linux -- 文件统计常用命令的更多相关文章

  1. Linux文件操作常用命令整理

    收集.整理日常系统管理或维护当中的,常用到的一些关于文件操作的命令或需求,后续会慢慢补充.完善! 查看.生成指定目录的目录树结构?   [root@DB-Server ~]#tree   #当前目录 ...

  2. linux 文件相关常用命令

    文件或者目录操控命令 1,cd切换目录. 其中- 代表前一个目录 2,mkdir 新建目录. 加上-p参数可以递归创建多级目录 mkdir -p test1/test2/test3 3,rmdir删除 ...

  3. Linux文件操作常用命令

    一.一些文件操作命令. 1.cd /home  进入"home目录" 2.cd ../ 返回上一级目录 3.cd -  返回上次所在的目录 4.pwd 显示工程路径 5.ll 显示 ...

  4. linux:终端常用命令 + vi命令修改文件及保存 方法

    首先介绍一下Ubuntu下各个目录的一般作用: /  这就是根目录,一台电脑有且只有一个根目录,所有的文件都是从这里开始的.举个例子:当你在终端里输入“/home”,你其实是在告诉电脑,先从/(根目录 ...

  5. Linux查看系统配置常用命令

    Linux查看系统配置常用命令: 系统 # uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本# cat /proc/cpuinfo ...

  6. linux vi编辑常用命令

      linux vi编辑常用命令 来源:互联网 作者:佚名 时间:07-10 21:31:14 [大 中 小] linux vi编辑常用命令,需要的朋友可以参考下   vi编辑器中有三种状态模式 1. ...

  7. Linux 系统巡检常用命令

    Linux系统巡检常用命令   # uname -a # 查看内核/操作系统# cat /etc/centos-release # 查看centos操作系统版本# cat /proc/cpuinfo ...

  8. linux 下 mysql 常用命令

    linux 下 mysql 常用命令   阅读目录 ====================== 1.开启和关闭 1.1.开启 1.2.关闭 1.3.重启 2.登录 2.1.密码明文 2.2.密码密文 ...

  9. Linux学习之CentOS(二)--初识linux的一些常用命令

    Linux学习之CentOS(二)--初识linux的一些常用命令 在VM上安装完了CentOS6.4以后,看着linux系统成功跑起来,心里小激动了一把......但是前方学习的道路还很遥远... ...

随机推荐

  1. Win8.1屏幕亮度自动调节关闭方法

    细心的朋友会发现,Win8.1系统的笔记本屏幕亮度有时候,会根据外界光线亮度以及温度自动调节屏幕亮度,尽管看似比较智能,但有时候我们并不希望笔记本屏幕亮度受光线影响,忽暗忽亮.如果我们希望Win8笔记 ...

  2. Windows内核 语言选择注意点

    调用约定: 调用约定指的是函数被调用时,会按照不同规则,翻译成不同的汇编代码.当一个函数被调用时,首先会将返回地址压入堆栈,紧接着会将函数的参数依次压入堆栈.不同的调用约定,会指明不同的参数入栈顺序, ...

  3. PLSQL Developer的使用

    登陆服务器 除了 sys 用户登陆之外,其他都都选Normal 新建sql 窗口 编写执行sql语句 设置字体.颜色 工具——首选项——用户界面——字体——选择 工具——首选项——用户界面——编辑器— ...

  4. 【iCore3 双核心板_FPGA】例程五:Signal Tapll实验——逻辑分析仪

    实验指导书及代码包下载: http://pan.baidu.com/s/1bnNRfaB iCore3 购买链接: https://item.taobao.com/item.htm?id=524229 ...

  5. Java与C++面向对象不同点

    首先面向对象的语言有哪些?JAVA.C++.C#等等.但是呢很多人认为C#和C++有关系,其实一点关系都是没有滴.C#是仿Java做的,很多人都说是假Java,因为C#和Java太像了比如C#也有st ...

  6. EditText中输入手机号码时,自动添加空格

    输入手机号码时,自动添加空格,更容易辨别 public class PhoneWatcher implements TextWatcher { private EditText _text; publ ...

  7. 为Docker容器指定自定义网段的固定IP/静态IP地址

    第一步:创建自定义网络 备注:这里选取了172.172.0.0网段,也可以指定其他任意空闲的网段 docker network create --subnet=172.172.0.0/16 docke ...

  8. CentOS6.0(64位)安装Apache+PHP+Mysql教程,安装Magento(解决DOM,Mcrypt,GD问题)完整教程

    CentOS6.0(64位)安装Apache+PHP+Mysql教程,安装Magento(解决DOM,Mcrypt,GD问题)完整教程 0   Posted by :小黑 On : 2012 年 9 ...

  9. .Net分布式架构(二):基于Redis的Session共享

    一:Session简介 Session是什么呢?简单来说就是服务器给客户端的一个编号.当一台web服务器运行时,可能有若干个用户浏览正在运正在这台服务器上的网站.当每个用户首次与这台web服务器建立连 ...

  10. C# 窗体

    窗体的事件:删除事件:先将事件页面里面的挂好的事件删除,再删后台代码里面的事件 Panel是一个容器 1.Label -- 文本显示工具Text:显示的文字取值.赋值:lable1.Text 2.Te ...