1.SOAPDenovo配置文件示例

软件下载安装和使用:http://soap.genomics.org.cn/soapdenovo.html

asm.cfg

#maximal read length
max_rd_len= [LIB]
avg_ins=450 #if sequence needs to be reversed
reverse_seq=0 #in which part(s) the reads are used
asm_flags=3 #use only first 100 bps of each read
rd_len_cutoff=100 #in which order the reads are used while scaffolding
rank=1 # cutoff of pair number for a reliable connection (at least 3 for short insert size)
pair_num_cutoff=
#minimum aligned length to contigs for a reliable read location (at least 32 for short insert size)
map_len=32
#a pair of fastq file, read 1 file should always be followed by read 2 file
q1=../../data/newBGIseq500_1.fq.gz
q2=../../data/newBGIseq500_2.fq.gz

运行脚本:

run.sh

/home/stu2/Software/Assemblathon1_pipeline/SOAPdenovo-63mer_v2. all -s  asm.cfg -K  -p  -R -o asm >cout.log >cerr.log
./SOAPdenovo-63mer_v2. pregraph -K  -s asm.cfg -o asm -p  >pregraph.log >pregraph.err
./SOAPdenovo-63mer_v2. contig -s asm.cfg -g asm -M -e -p -R -D >contig.log >contig.err
./SOAPdenovo-63mer_v2. map -s asm.cfg -g asm -k -p >map.log >map.err
./SOAPdenovo-63mer_v2. scaff -g asm -p -F >scaff.log >scaff.err

02. VCFtools的使用

软件下载和使用:

https://vcftools.github.io/documentation.html

https://vcftools.github.io/man_latest.html

# get Qual
./vcftools --gzvcf chr17.vcf.gz --site-quality --out Qual
# get interval
./vcftools --gzvcf chr17.vcf.gz --chr chr17 --from-bp --to-bp --remove-indels --out TP53 --recode

03.变异位点信息统计

#!/usr/bin/perl
use strict; my $file = shift; open(In,"gzip -dc $file|") or die ("can't open the file!\n"); my @type;
my @array = ( );
while(<In>){
chomp;
next if (/^##/);
if (/^#/){
my @line = split;
push @type, $line[];
push @type, $line[];
push @type, $line[];
next;
}
my @line = split;
if ($line[] >= && $line[] <= && $line[] ne "."){
my @type1 = split(/\/|:/, $line[]);
my @type2 = split(/\/|:/, $line[]);
my @type3 = split(/\/|:/, $line[]);
#print "$type1[0]\t$type1[1]\n";
if ($type1[]==$type1[]){
$array[][] ++;
}else{
$array[][] ++;
}
if ($type2[] == $type2[]){
$array[][] ++;
}else{
$array[][] ++;
}
if($type3[] == $type3[]){
$array[][] ++;
}else{
$array[][] ++;
}
}
}
close IN; print "Sample\tHomozygous\tHeterozygote\n";
print "$type[0]: $array[0][0]\t$array[0][1]\n";
print "$type[1]: $array[1][0]\t$array[1][1]\n";
print "$type[2]: $array[2][0]\t$array[2][1]\n";

04. KmerFreq使用脚本

工具包地址:ftp://public.genomics.org.cn/BGI/SOAPdenovo2

kmer.sh

./kmerfreq -k  -l lib.list -t  >17mer.freq >17mer.log

lib.list

 reads1.fq.gz
reads2.fq.gz

友情参考链接:http://20xue.com/3997.htmlhttps://www.cnblogs.com/azrael-cc/

生信分析常用脚本(二)--SOAPdenovo的更多相关文章

  1. MS SQL 日常维护管理常用脚本(二)

    监控数据库运行 下面是整理.收集监控数据库运行的一些常用脚本,也是MS SQL 日常维护管理常用脚本(一)的续集,欢迎大家补充.提意见. 查看数据库登录名信息   Code Snippet SELEC ...

  2. 监控数据库运行 - MS SQL 日常维护管理常用脚本(二)

    查看数据库登录名信息 use mastergoSELECT name AS LoginName , dbname AS DefaultDB , createdate AS CreateDate, up ...

  3. 生信基础知识【04】GO和pathway分析

    非原创 参考资料: 一文掌握GO和pathway分析 - 生物信息学讨论版 -丁香园论坛http://www.dxy.cn/bbs/thread/34904124#34904124 GO富集 GO是G ...

  4. 精心整理(含图版)|你要的全拿走!(R数据分析,可视化,生信实战)

    本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/ZEjaxDifNATeV8fO4krOIQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号. 为 ...

  5. 常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript

    常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript Javascript现阶段还不适合用来做独立开发,它的天下还是在web应用 ...

  6. (转载)shell日志分析常用命令

    shell日志分析常用命令总结 时间:2016-03-09 15:55:29来源:网络 导读:shell日志分析的常用命令,用于日志分析的shell脚本,统计日志中百度蜘蛛的抓取量.抓取最多的页面.抓 ...

  7. wavecom短信猫常用AT命令

    wavecom短信猫常用AT命令 一.一般命令 1. AT+CGMI 给出模块厂商的标识. 2. AT+CGMM 获得模块标识.这个命令用来得到支持的频带 (GSM 900,DCS 1800 或PCS ...

  8. 游戏编程之Unity常用脚本类的继承关系

    前言学习Unity开发引擎的初学者会接触大量的脚本类,而这些类之间的关系往往容易被忽略.本文对Unity引擎开发中的一些常用类及其关系进行了简单的归纳总结. 博文首发地址:http://tieba.b ...

  9. oracle 常用脚本以及语句

    oracle 常用脚本以及语句 一.oracle 安装10G 单机初始化环境: #!/bin/bash #关闭selinuxsed -i 's\SELINUX=enforcing\SELINUX=di ...

随机推荐

  1. ubuntu下的git版本创建

    一.git的特点 二.gei的安装和配置 1.安装命令如下 sudo apt-get install git 2.安装成功后输入 git 3.创建版本库 git init 4.使用 先创建一个txt文 ...

  2. leetcode每日刷题计划-简单篇day12

    Num 125 验证回文串 Valid Palindrome 非常有收货的一道题嘻嘻嘻,本来是考试期间划水挑的题,坑点有点多 第一个是注意对temp1和temp2中途更新的判断 第二个是字符串频繁的作 ...

  3. Java Design Patterr

    Factory: ●简介: 工厂模式同单例模式一样,也是Java中最常用的设计模式之一,属于创建型模式,它提供了一种创建对象的最佳方式.能够根据要求调用者提供的信息为接口指定不同的实现类,降低耦合. ...

  4. UBNT ex-r +netgear gs105e v2 +ap 设置vlan 步骤记录 及相关知识整理

    设备连接:路由器ex-r的eth0 连接 光猫拨号,eth3连接交换机gs105e,交换机gs105e的eth3连接无线ap 需求:路由器拨号上网,通过不同ssid的无线网络可以连接不同vlan,且交 ...

  5. MAIL服务器搭建

    一,邮件服务: 优    点 缺   点 应 用 sendmail 有点年代久远,稳定功能多 太过于臃肿,配置文件多且繁琐 6以前默认 postfix 优点更稳定,且交轻便 发布年限较短,市场占有率低 ...

  6. Intellij IDEA常用快捷键介绍 Intellij IDEA快捷键大全汇总

    其他的快捷键还有很多,象Ctrl+G(跳转到指定行).Ctrl+F4(关闭当前编辑页面).Ctrl+F(搜索)等等,这些快捷键由于是各个编辑器都会提供的,而且定义的键位也都差不多,就没什么可说的了: ...

  7. 序列号多个input输入demo

    <input class="inputs" type="text" maxlength="4" /> <input cla ...

  8. 【COCI 2015/2016 #3】Nekameleoni

    题目描述 “这好难啊,我有一个简单点的题,他们解决不了.” AKPAKP有一个长度为nn的线段,这个线段原来染有颜色,AKPAKP只认识kk种颜色.当然原来的颜色也包含在着kk种颜色之间. 可以进行m ...

  9. numpy统计分布显示

    #导包 import numpy as np #导入鸢尾花数据 from sklearn.datasets import load_iris data = load_iris() pental_len ...

  10. 前端笔记-jquery

    一.什么是jquery 1.jQuery由美国人John Resig创建,至今已吸引了来自世界各地的众多 javascript高手加入其team 2.jQuery是继prototype之后又一个优秀的 ...