近期对序列文件处理的比較多,时常要看一些核酸序列的反向互补序列,长度。可能的翻译序列。

曾经我常用seqBuider 来查看。假设能在命令行直接查看。想必是极好的。

这是一个perl脚本。只是我把它的运行路径写入环境变量后。就能够当linux命令直接使用了,非常方便的。

这个脚本有四个參数。【-i -r -p -l 】

当中

-i 是必要的參数,用来接收标准输入;

-r 是获得一段序列的反向互补序列(50个字符一行的格式输出)。

-p 是提供一段序列的ORF框架序列,即三种可能的pep翻译(50个字符一行的格式输出)。

-l 获取一段序列的长度。

假设【-r-p-l】都是缺省状态的话。默认三种结果都输出。

在linux配置文件 ~/.bashrc 文件能够写入:

alias tfa=' perl /yourpath/transfa.pl'

这样以后在linux命令行运行 tfa 命令,出现:

Usage: tfa <STDIN>[-i-r-p-l]

这种使用提示。

整个代码例如以下:

#! /usr/bin/perl -w
use strict;
use Getopt::Long;
my ($i,$r,$p,$l);
GetOptions(
"i!"=>\$i,
"r!"=>\$r,
"p!"=>\$p,
"l!"=>\$l,
);
my $usage = "\nUsage: tfa <STDIN>[-i-r-p-l]\n";
die "$usage\n" unless $i;
print "Please input the nucleotide sequence,and end by ctrl+D.\n\n";
unless($r || $p || $l){
($r,$p,$l)=(1,1,1);
}
my $fa;
do{local $/;chomp($fa=<STDIN>)};
$fa =~ s/\s+//g;
die "$usage\n" unless $fa; if($r){
my $faout = reverse_complement($fa);
$faout = out_fasta($faout,50);
print "\n###rc###\n$faout\n";
}
if($p){
my @fa_arr = cds2pep($fa);
print "\n###protein###\n";
$fa_arr[0] = out_fasta($fa_arr[0],50);
print "ORF1:\n$fa_arr[0]\n";
$fa_arr[1] = out_fasta($fa_arr[1],50);
print "ORF2:\n$fa_arr[1]\n";
$fa_arr[2] = out_fasta($fa_arr[2],50);
print "ORF3:\n$fa_arr[2]\n"; }
if($l){
my $len = length $fa;
print "\n###Length###\n$len\n";
}
#####################
sub out_fasta{
my ($seq,$num) = @_;
my $len = length $seq;
$seq =~ s/([A-Za-z]{$num})/$1\n/g;
chop($seq) unless $len % $num;
return $seq;
}
#####################
sub reverse_complement{
my ($seq)=shift;
$seq=reverse$seq;
$seq=~tr/AaGgCcTt/TtCcGgAa/;
return $seq;
}
#####################
sub cds2pep{
my $seq=shift;
##phase0
my $str0 = $seq;
$str0 = trans($str0);
##phase1
my $str1 = substr($seq,1);
$str1 = trans($str1);
##phase0
my $str2 = substr($seq,2);
$str2 = trans($str2);
return ($str0,$str1,$str2);
}
#####################
sub trans{
my $seq = shift;
my $p = code();
my $out;
for(my $i=0;$i<length$seq;$i+=3){
my $codon=uc(substr($seq,$i,3));
last if (length$codon <3);
$out.= exists $p->{"standard"}{$codon} ? $p->{"standard"}{$codon} : "X";
}
return $out;
}
#####################
sub code{
my $p={
"standard" =>
{
'GCA' => 'A', 'GCC' => 'A', 'GCG' => 'A', 'GCT' => 'A', # Alanine
'TGC' => 'C', 'TGT' => 'C', # Cysteine
'GAC' => 'D', 'GAT' => 'D', # Aspartic Aci
'GAA' => 'E', 'GAG' => 'E', # Glutamic Aci
'TTC' => 'F', 'TTT' => 'F', # Phenylalanin
'GGA' => 'G', 'GGC' => 'G', 'GGG' => 'G', 'GGT' => 'G', # Glycine
'CAC' => 'H', 'CAT' => 'H', # Histidine
'ATA' => 'I', 'ATC' => 'I', 'ATT' => 'I', # Isoleucine
'AAA' => 'K', 'AAG' => 'K', # Lysine
'CTA' => 'L', 'CTC' => 'L', 'CTG' => 'L', 'CTT' => 'L', 'TTA' => 'L', 'TTG' => 'L', # Leucine
'ATG' => 'M', # Methionine
'AAC' => 'N', 'AAT' => 'N', # Asparagine
'CCA' => 'P', 'CCC' => 'P', 'CCG' => 'P', 'CCT' => 'P', # Proline
'CAA' => 'Q', 'CAG' => 'Q', # Glutamine
'CGA' => 'R', 'CGC' => 'R', 'CGG' => 'R', 'CGT' => 'R', 'AGA' => 'R', 'AGG' => 'R', # Arginine
'TCA' => 'S', 'TCC' => 'S', 'TCG' => 'S', 'TCT' => 'S', 'AGC' => 'S', 'AGT' => 'S', # Serine
'ACA' => 'T', 'ACC' => 'T', 'ACG' => 'T', 'ACT' => 'T', # Threonine
'GTA' => 'V', 'GTC' => 'V', 'GTG' => 'V', 'GTT' => 'V', # Valine
'TGG' => 'W', # Tryptophan
'TAC' => 'Y', 'TAT' => 'Y', # Tyrosine
'TAA' => 'U', 'TAG' => 'U', 'TGA' => 'U' # Stop
}
## more translate table could be added here in future
## more translate table could be added here in future
## more translate table could be added here in future
};
return $p;
}

__END__

在命令行获取标准输入序列的反互序列,pep序列和长度信息的更多相关文章

  1. Shell 命令行获取本机IP,grep的练习

    Shell 命令行获取本机IP,grep的练习 在 mac 下面输入 ifconfig 或者在 linux 下面输入 ip a 就可以得到我们的网卡信息.不过通常情况下,我们需要查看的是我们的IP地址 ...

  2. 命令行获取docker远程仓库镜像列表

    命令行获取docker远程仓库镜像列表 获取思路 通过curl获取镜像tag的json串,解析后得到${image}:${tag}的格式 curl获取示例 # curl [:-s] ${API}/${ ...

  3. python命令行获取参数

    python命令行获取参数 import sys # python获取参数 input_file = sys.argv[1] output_file = sys.argv[2] print(input ...

  4. MySQL数据库(9)----从命令行获取元数据

    1. mysqlshow 命令提供的信息与某些 SHOW 语句很相似,因此可以从命令行提示符获取数据库和表的信息. (i)列出服务器所管理的数据库: root@javis:~$ mysqlshow - ...

  5. Linux 命令行获取天气

    目标: 使用 Linux 命令行显示天气预报. 发行版: 所有 Linux 发行版. 要求: 能连上因特网的 Linux 难度: 容易 约定: # - 需要使用 root 权限来执行指定命令,可以直接 ...

  6. nodejs 命令行获取入参

    安装:npm install yargs --save-dev Example index.js const argv = yargs.alias('n', 'name').alias('p', 'p ...

  7. Mac下用命令行获取苹果手机的UDID

    在终端输入命令行:system_profiler SPUSBDataType | grep "Serial Number:.*" | sed s#".*Serial Nu ...

  8. windows命令行获取时间

    在写Windows批处理脚本时,常常需要获取系统日期.时间戳记,用作文件名.文件夹名.log等等. 本文介绍了如何获取自订的系统日期.时间戳记. 首先,在Windows中,系统日期由以下参数获得: % ...

  9. 用Linux命令行获取本机外网IP地址

    引言:目前获取ip的方法中,ifconfig和ip获取函数得到的都是内网ip.有时候需要获取外网ip,目前通用的做法,是向外部服务器发送请求,解析外部服务器响应,从而得到的自己的外网ip.linux下 ...

随机推荐

  1. 【Maven】pom.xml 配置 eclipse错误

    <!-- servlet --> <dependency> <groupId>javax.servlet</groupId> <artifactI ...

  2. 转化为用欧几里得算法判断互质的问题D - Wolf and Rabbit

    Description There is a hill with n holes around. The holes are signed from 0 to n-1. A rabbit must h ...

  3. linux 工具: Top

    linux TOP命令各参数详解[转载] http://www.cnblogs.com/sbaicl/articles/2752068.html

  4. chrome 浏览器帐号登录不来,如何解决自己的书签

    装系统前把 该目录下  C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default    的  Bookmarks 复制出 ...

  5. python成长之路——第二天

    cpython:c解释器  .pyc(字节码)——机器码 jpython :java解释器   java字节码   ironpython :C#解释器   C#字节码   .... 上面的:编译完之后 ...

  6. HDOJ1232 并查集

    所谓并查集 并:Union 查:Find 定义 并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题.常常在使用中以森林来表示. 集就是让每个元素构成一个单 ...

  7. Python关键字yield详解以及Iterable 和Iterator区别

    迭代器(Iterator) 为了理解yield是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项 ...

  8. 常用位操作,读8位 I2C 1302 18B20 .

    /*1302*/ unsigned char DS1302OutputByte(void) //实时时钟读取一字节(内部函数) { unsigned char i; for(i=8; i>0; ...

  9. HDOJ 2120 并查集

    并查集的应用,用来查找被分割的区域个数. 即当两个节点值相同时说明已经为了一个圈,否则不可能,此时区域个数加1. #include<iostream> #include<cstdio ...

  10. 新鲜出炉的Using Qt 3D to visualize music

    http://blog.qt.io/blog/2016/01/27/using-qt-3d-visualize-music/