#!/usr/bin/env python # usages: python extract_seq_by_pos.py input.fasta id_start_end > result.fasta import sys import re FASTA= sys.argv[1] BED= sys.argv[2] fasta= open(FASTA, 'U') fasta_dict= {} for line in fasta: line= line.strip() if line == '':…
在介绍summary.seqs的用法之前,我们首先需要搞清楚两个概念: 1)ambiguous bases 中文叫做模糊碱基,对于DNA序列来说,只有ATCG 4种碱基,在IUPAC定义的碱基标准中,出了上述4种碱基之外,还包括其他的碱基,可以代表不同类型的碱基 代码 英文含义 中文含义 G   Guanine 鸟嘌啉 A   Adenine 腺嘌啉 T (U) Thymine (Uracil) 胸腺嘧啶 (尿嘧啶) C   Cytosine 胞嘧啶 R (A or G) PuRine 嘌啉 Y…
生信人的自我修养:Linux命令速查手册 简佐义 ​ 四川大学 生物信息学硕士 科学求真 赢 10 万奖金 · 院士面对面 209 人赞同了该文章 许多人做生物信息学,要么不重视Linux,要么不知道怎么才能学好.翻开厚厚的一本教材,却不知道哪些是重点.Linux的核心知识有哪些,就像英语的核心词汇一样.这篇文章,给你答案. 只要几个小时,掌握生信所需的90%以上的Linux知识,让你一举攻克Linux难关.--生信老司机 man - 获得帮助 man ls # 许多Linux自带命令可以通过m…
一.关于程序: FUN:计算FASTA文件中每条序列中G和C的含量百分比,输出最大值及其id INPUT:FASTA格式文件 >seq1 CGCCGAGCGCTTGACCTCCAGCAAGACGCCGTCTGGCACATGCAACGAGCTGTAGCAGAC >seq2 ATGCCTAGAACGTTCGAGACTTCTCGGGTGCGGTAGAATTAGCCATTCGACCGACTTCCA GCATCTGCGAGCCGCCTGTTGATTGCATCCGCCGGGGACGCAACAAGGCAAG…
Linux中fasta文件的拆分与合并 FASTA文件的拆分: (1)如果从一个文件a提取第11至20个序列存到另一个文件b: awk -v RS='>' 'NR>1{i++}i>=10&&i<=21{print ">"$0}' a.fasta|sed '/^$/d'>b.fasta (2)将某一文件a中每一条序列保存到一个文件中: awk '/^>/{f=++d".fasta"} {print > f…
目标如题,有多个fasta文件和一个文件名列表,将文件名列表中包含的文件匹配出来并提取第一条序列合并成一个fa文件. 这个采用perl实现,用法和代码如下: 1 #!/usr/bin/perl -w 2 use strict; 3 4 sub usage{ 5 die "usage:perl $0 <fa.list> <Fasta_Dir> <merged.fa>\n",unless(@ARGV==3); 6 } 7 usage(); 8 9 ope…
1       案例描述 作为Windows程序员,平时最担心见到的事情可能就是程序发生了崩溃(异常),这时Windows会提示该程序执行了非法操作,即将关闭.请与您的供应商联系.呵呵,这句微软的“名言”,恐怕是程序员最怕见也最常见的东西了. 在一个大型软件的测试过程中,初期出现程序崩溃似乎成了不可避免的事.其实测试中出现程序崩溃并不可怕,反而是测试的成功.作为开发的我们更需要关心的是程序中的哪个函数或哪一行导致了系统崩溃,这样才能有针对性的进行改正. 本文描述了自己总结的几种定位崩溃的办法.…
//在一个exe文件中查找指定内容,找到则返回起始位置, 否则返回0//如果某字符串, 直接传入字符串进来//如果要查找16进制,则用如下格式传参进来: #$1A#$2A#$3A function FindString(FileName, FindStr: string): Int64; var FileStream: TFileStream; i: Int64; Buff: string; begin FileStream := TFileStream.Create(FileName, fmO…
第一次学习PE结构,也不知道有没有更好的办法. 1.AddressOfEntryPoint 这个成员在OptionalHeader里面,OptionalHeader的类型是一个IMAGE_OPTIONAL_HEADER32结构.该结构总共有31个成员,占的大小为224字节.成员7就是AddressOfEntryPoint.AddressOfEntryPoint占4个字节.它表示的是代码入口的RVA地址.也就是说,把一个文件加载到内存的时候,基地址加上AddressOfEntryPoint就是我们…
Shader.Find 查找 static function Find (name : string) : Shader Description描述 Finds a shader with the given name. 查找名为name的着色器. Shader.Find can be used to switch to another shader without having to keep a reference to the shader. name is the name you ca…