1、解析路径获取文件名和目录名。

获取文件名

     #awk解法:用“/”做分隔符,然后打印出最后的那一部分。

resFile=`echo /tmp/csdn/zhengyi/test/adb.log | awk -F "/" '{print $NF}'`

#官方解法(basename):Bash Shell本身提供了basename命令,可以直接获取路径名最后的文件名。

resFile=`basename /tmp/csdn/zhengyi/test/adb.log`

    获取目录名

    #awk解法:可以灵活的使用分隔符,混合正则表达式。

dirPath=`echo /tmp/csdn/zhengyi/test/adb.log | awk -F '/[^/]*$' '{print $1}'`

#awk+for循环的方法

echo /tmp/csdn/zhengyi/test/adb.log | awk 'BEGIN{res=""; FS="/";}{ for(i=2;i<=NF-1;i++) res=(res"/"$i);} END{print res}'

#官方解法(basename):Bash Shell本身提供了dirname命令,特别方便,可以直接获取路径对应的目录名。

dirPath=`dirname /tmp/csdn/zhengyi/test/adb.log`

2、Soap文件中求出每个染色体的总测序长度(即第6列的加和)。

=> head test.soap
SIMU_0001_00000001/    AAATATGTGGATATAAACACATTCCTAAATAACCG     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr1          A->11T40 35M     11A23
SIMU_0001_00000002/    CCGGGGCCCAGCGCAGGGGCTGATGAGAAGGCACT     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr2          35M
SIMU_0001_00000003/    TTCCCCTTTGATCTGATGTCCACCTGGAAACCGTG     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr2          35M
SIMU_0001_00000004/    TTTATATGGTGTTAGCCTTTCTTCCAAATTTTAAG     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr3          A->14G40 35M     14A20
SIMU_0001_00000005/    ACCCATGGCAGACCCCCTTATCTTAACTCAAGTGT     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr1          A->2C40  35M     2A32
SIMU_0001_00000006/    GCTTACACTGGAATTAACAAGTTTTAGTATATTAT     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr10         35M
SIMU_0001_00000009/    TTTTCTTCTATGAAGTTTGGGAGAAAAGTCAAGAT     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr1          35M
SIMU_0001_00000010/    GGTCACCACAGAATATGATATAAATAAGATAAATA     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr2          35M
SIMU_0001_00000011/    TACTTTTGGATTATATGCTAAACAGTGTGACTATA     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr1          35M
SIMU_0001_00000013/    TTCCCTGGTAAGGGCTCATGCCTTGGCACTGAGGG     hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh            a             -       chr12         35M      35    

#awk代码实现:

=> head test.soap |awk '{a[$8]+=$6}END{for (i in a) print i,"\t",a[i]}'
chr10
chr12
chr1
chr2
chr3     

3、Linux下用awk计算Fasta序列的长度

=> cat contig.fa
> cvg_0.0_tip_0
ATTTTGGCTTTGGAAGGGC
> cvg_0.0_tip_0
GAATAGTGATACAAATTATATAGTTTCAAGTATGTGACTTGAACATGAGATTAT
> cvg_0.0_tip_0
TAATCTAGGCTTGAAACTATATAATTTGTATCACTATTCTAAGGATTTTTTT

首先通过下面的命令将fasta序列转换成一行显示,命令如下:

=> awk '/^>/&&NR>1{print "";}{ printf "%s",/^>/ ? $0" ":$0 }'  contig.fa
或者:
=> awk '{ printf "%s",/^>/ ? $0" ":$0"\n" }' contig.fa

得到如下结果:

如果想直接显示每条序列的长度,可以运行如下命令:

=> awk '/^>/&&NR>1{print "";}{ printf "%s",/^>/ ? $0" ":$0 }'  contig.fa |awk '{print $1"\t"length($3)}'

得到结果如下:

>
>
>      

shell命令实战详解的更多相关文章

  1. Linux vmstat命令实战详解

    vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况.这个命令是我查看Linux/Unix最 ...

  2. (转)Linux vmstat命令实战详解

    vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况.这个命令是我查看Linux/Unix最 ...

  3. [svc]Linux vmstat命令实战详解

    vmstat输出 注:是cpu 内存 磁盘 虚拟内存交换情况 io读写情况 vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存 ...

  4. 【转】Linux vmstat命令实战详解

    好久没写博客了,上个月忙的晕头转向的实在没有心情.最近会发几篇PowerDNS的,先预告一下. 这篇是纯转的,原贴地址:http://www.cnblogs.com/ggjucheng/archive ...

  5. Linux命令学习笔记- vmstat命令实战详解

    vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况.这个命令是我查看Linux/Unix最 ...

  6. shell编程系列23--shell操作数据库实战之mysql命令参数详解

    shell编程系列23--shell操作数据库实战之mysql命令参数详解 mysql命令参数详解 -u 用户名 -p 用户密码 -h 服务器ip地址 -D 连接的数据库 -N 不输出列信息 -B 使 ...

  7. Linux Shell脚本编程--nc命令使用详解

    linux nc命令使用详解     功能说明:功能强大的网络工具 语 法:nc [-hlnruz][-g<网关...>][-G<指向器数目>][-i<延迟秒数>] ...

  8. Linux Shell脚本入门--wget 命令用法详解

    Linux Shell脚本入门--wget 命令用法详解 wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上.它有以下功能 ...

  9. (转)shell中test命令方法详解

    test命令用法.功能:检查文件和比较值 shell中test命令方法详解 原文:https://www.cnblogs.com/guanyf/p/7553940.html 1)判断表达式 if te ...

随机推荐

  1. 工厂类分离与java反射机制

    网易 博客 发现 小组 风格 手机博客 玩LOFTER,免费冲印20张照片!> 创建博客登录  加关注 黙言-在路上 奋斗 首页 日志 相册 音乐 收藏 博友 关于我             黙 ...

  2. c++到c#数据类型的转换

    c++与c#的类型转换 分类:cSharp | 标签: c#  system  intptr  char  uint  2012-02-29 19:54 阅读(513)评论(0)编辑删除 //c++: ...

  3. JS函数——作用域

    一 : 作用域的相关概念 首先看下 变量作用域 的概念:一个变量的作用域是程序源代码中定义这个变量的区域.————————<javascript权威指南>第六版全局变量拥有全局作用域,函数 ...

  4. windows下安装NodeJs

    1.官网(//nodejs.org/en/)下载系统匹配的文件 2.双击安装,完成后发现nodejs文件夹下面有npm, 直接用npm安装其他环境既可 3.如果配置了环境变量,直接Win+R后CMD调 ...

  5. Linux系统重启network服务失败

    问题描述 使用KVM通过修改配置文件配置好网卡IP,使用命令行service network restart 重启网络服务失败. 如图: 使用图形化管理工具配置IP,在系统界面右上角可以看到网卡状态为 ...

  6. MySQL RR隔离 读一致性

    MySQL RR 模式下 事务隔离问题: Session 1: mysql> select * from test; +------+------+ | id | name | +------+ ...

  7. Unity3d GUI弹窗

    ArrayList w_position = new ArrayList(); void OnGUI() { if (GUILayout.Button("Open")) { if ...

  8. Spring、AOP详解

    如何配置AOP查看:Spring.Hello AOP 1.对于拦截规则@Pointcut的介绍: @Pointcut("execution (* cn.raffaello.service.. ...

  9. 网易云课堂_程序设计入门-C语言_第五周:函数_1分解质因数

    1 分解质因数(5分) 题目内容: 每个非素数(合数)都可以写成几个素数(也可称为质数)相乘的形式,这几个素数就都叫做这个合数的质因数.比如,6可以被分解为2x3,而24可以被分解为2x2x2x3. ...

  10. UCS2转UTF-8方法

    前两天工作时需要将UCS2编码转为UTF-8编码在网页显示.网上找了好久没有好方法,后来还是同事给了一个自己的函数,顺利解决问题.把函数贴在这里,愿帮助遇到同样问题的工友们~ /**      * U ...