FASTA/Q序列处理神器---seqkit
该软件对于处理FASTA/Q十分方便,省去自己编写脚本
安装
1 conda install seqkit
使用
序列操作(seq)
1 ## 取方向序列
2 seqkit seq test.fa -r > test_re.fa
3
4 ## 取互补序列
5 seqkit seq test.fa -p > test_com.fa
6
7 ## 取方向互补序列
8 seqkit seq test.fa -r -p > test_re_com.fa
9
10 ## RNA---> DNA序列
11 seqkit seq test.fa rna2dna > test_dna.fa
12
13 ## 小写字母输出
14 seqkit seq test.fa -l > test_lower.fa
15
16 ## 大写字母输出
17 seqkit seq test.fa -u > test_upper.fa
18
19 ## 指定每行序列的输出长度(为0的话,代表为一整行,默认的输出 长度是60个碱基)
20 seqkit seq test.fa -w 10 > test_10.fa (指定序列的长度为10)
21
22 ## 将多行序列转换为一行序列
23 seqkit seq test.fa -w 0 > test_w.fa
24
25 ## 只输出序列
26 seqkit seq test.fa -s -w 0 > test_seq.fa
27
28 ## 将只输出的序列的,指定每行输出的碱基数
29 seqkit seq test_seq.fa -s -w 40 > test_seq40.fa
Fasta/q之间以及与tab格式互换
1 ## 将fataq文件转化为fasta格式.
2 seqkit fq2fa test.fq -o test.fa
3
4 ## 将fasta格式转化为tab格式
5 seqkit fx2tab test.fa > test_tab.fa (没有seq参数)
序列信息统计
1 ## 序列碱基含量
2 seqkit fx2tab -l -g -n -i -H test.fa
3
4 ## 序列长度的整体分布统计
5 seqkit stat test.fa
提取序列(grep)
1 ## 给定基因名字,gene.txt; 从基因所对应的fasta文件提取序列;
2 seqkit grep -f gene test.fa |seqkit seq -i >gene.fa
3 ## 参数
4 -i: 只输出ID,后面的信息不输出,比如长度等信息
-----END-----
关注下方公众号可获得更多精彩

FASTA/Q序列处理神器---seqkit的更多相关文章
- 用 perl 统计 fasta 文件序列的总长
#!/usr/bin/perl -w use strict; die "Usage: $0 <file>\n" unless (@ARGV == 1); my $lin ...
- 【awk】用awk将Fasta文件序列变成一行
awk: awk '/^>/&&NR>1{print "";}{ printf "%s",/^>/ ? $0" &q ...
- mVISTA 多序列比对叶绿体基因组
mVISTA可对2个或者多个DNA序列进行比较,可以对比对结果进行可视化. 详情请大力戳这里 0 输入文件说明 mVISTA 需要输入的文件有如下几类 必须文件 邮箱 fasta格式序列文件(或者GE ...
- samtools常用命令详解
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtmlsamtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下 ...
- fastx_toolkit软件使用说明
高通量测序数据下机后的原始fastq文件,包含4行,其中一行为质量值,另外一行则为对应序列,我们都了解高通量的数据处理首先要进行质量控制,这些过程包括去接头.过滤低质量reads.去除低质量的3'和5 ...
- samtools常用命令详解(转)
转自:samtools常用命令详解 samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和ba ...
- SAMTOOLS使用 SAM BAM文件处理
[怪毛匠子 整理] samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS m ...
- BWA/BWT 比对软件
名称 bwa – Burrows-Wheeler Alignment Tool 内容摘要描述命令行与选项SAM 比对格式短序列比对注意事项 比对精确性 估计插入大小分布 内存需求 ...
- samtools软件作用
samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集,包含有许多命令.以 ...
随机推荐
- 使用Servlet前Tomcat介绍
虚拟目录的映射方式:让tomcat服务器自动映射tomcat服务器会自动管理webapps目录下的所有web应用,并把它映射成虚似目录.换句话说,tomcat服务器webapps目录中的web应用,外 ...
- Java集合 - 集合知识点总结概述
集合概述 概念:对象的容器,定义了对多个对象进项操作的的常用方法.可实现数组的功能. 和数组的区别: 数组长度固定,集合长度不固定. 数组可以存储基本类型和引用类型,集合只能存储引用类型. 位置: j ...
- Beta阶段第二次会议
时间:2020.5.18 工作进展 姓名 工作 难度 完成度 ltx 1.在开小程序开发文档,学习相关知识 轻 85% xyq 1.完成活动场地申请可视化代码(耗时半天) 中 100% lm 1.设计 ...
- 热身训练3 Palindrome
Palindrome 简要题意: 我们有一个字符串S,字符串的长度不超过500000. 求满足S[i]=S[2n−i]=S[2n+i−2](1≤i≤n)(n≥2)的子串个数. 分析: 我们能通过简 ...
- 2021.9.9考试总结[NOIP模拟50]
T1 第零题 神秘结论:从一个点满体力到另一个点的复活次数与倒过来相同. 于是预处理出每个点向上走第$2^i$个死亡点的位置,具体实现可以倍增或二分. 每次询问先从两个点同时向上倍增,都转到离$LCA ...
- 顺时针打印矩阵 牛客网 剑指Offer
顺时针打印矩阵 牛客网 剑指Offer 题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下4 X 4矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 ...
- Python展示文件下载进度条
前言 大家在用Python写一些小程序的时候,经常都会用到文件下载,对于一些较小的文件,大家可能不太在乎文件的下载进度,因为一会就下载完毕了. 但是当文件较大,比如下载chromedriver的时候, ...
- Linux 安装nacos
1.已有mysql环境 2.解压文件 #tar -zxvf package/nacos-server-2.0.1.tar.gz 3.创建数据库nacos_config(confnacos-mysql. ...
- nohup java -jar xx.jar & ,关闭窗口后退出进程
nohup java -jar dw-report..jar > dw-report.log & 自动退出命令在后台运行 xx.jar程序 明明已经加了"&" ...
- httprunner3源码解读(2)models.py
源码目录结构 我们首先来看下models.py的代码结构 我们可以看到这个模块中定义了12个属性和22个模型类,我们依次来看 属性源码分析 import os from enum import Enu ...