介绍
============ Wgsim是从参照基因组中模拟序列的小工具。
它能够模拟二倍体基因组与SNP和插入/缺失(INDEL)
多态性,并能够模拟均匀替代测序错误的reads。
它不产生INDEL测序错误,但是这可能是部分地
通过模拟INDEL多态性补偿。 Wgsim输出是模拟多态性,并写入真正的reads坐标
以及在reads名称的多态性和测序错误的数量。
我们可以wgsim_eval.pl自带的包评估映射的准确性或SNP caller。 编译
=========== GCC -g -O2 -Wall -o wgsim wgsim.c -lz -lm 评估
========== 仿真与评估
------------------------- 仿真命令行: wgs​​im -Nxxx -1yyy -d0 -S11 -e0 -rzzz hs37m.fa YYY-zzz.fq的/ dev / null的 其中yyy是read长,zzz为错误率和$ XXX * $ YYY =10000000。
默认情况下,多态性的15%以上是插入缺失和它们的长度是从绘制
几何分布密度0.7 * 0.3 ^ {L-1}。 评估命令行: wgs​​im_eval.pl独特aln.sam | wgs​​im_eval.pl alneval -g 20 在'-g'选项可以和映射器来改变。 系统
------
GCC: 4.1.2
CPU: AMD Opteron 8350 @ 2.0GHz
Mem: 128GB 实际操作:

使用过的命令:

../seqtk_concat   out_1.fq  out_2.fq | head -n 8

../seqtk_concat   out_1.fq  out_2.fq  >  ../wgsim.fq   #双端序列合并

seqtk_names  wgsim.fq  | cut -f1,2 -d'_'| cut -f3 -d'|' | perl -ane 's/chr\S+/9606/; print' | perl -ne 'print qq{$.\t$_}' | tabtk_bins - 1 >tabtk_stats

seqtk_names  wgsim.fq  | cut -f1,2 -d'_'| cut -f3 -d'|' | perl -ane 's/chr\S+/9606/; print' | perl -ne 'print qq{$.\t$_}' | tabtk_bins - 1 >tabtk_stats.tsv

cut -f1,2 tabtk_stats.tsv | tabtk_decorate  /biostack/database/taxonomy/node-name.tsv   0  -  > tab.xls
/*

解释:
perl -ane 's/chr\S+/9606/; print'    将每一行中包含chr并且其后非空格部分(比如chrab和chrbc)替换为9606
perl -ne 'print qq{$.\t$_}'  打印每一行的行号和内容;
可简化为:
|perl -ane 's/chr\S+/9606/; print qq{$.\t$_}'  或 perl -ane 's/chr\S+/9606/; print qq{$.\t$_}'

*/

cut说明:

cut 不就是『切』吗?没错啦!这个指令可以将一段讯息的某一段给他『切』出来~ 处理的讯息是以
『行』为单位喔!

常用的参数:

												

wgsim说明的更多相关文章

随机推荐

  1. Java学习之多态

    多态的概念 多态==晚绑定. 不要把函数重载理解为多态. 因为多态是一种运行期的行为,不是编译期的行为. 多态:父类型的引用可以指向子类型的对象. 比如 Parent p = new Child(); ...

  2. jdbc执行预处理,批处理,LOB字段处理,调用存储过程

    (1)jdbc执行预处理 PreparedStatment预备语句 eg:String sql="insert into user(id,name,birthday,money) value ...

  3. hibernate整合spring开发的时候遇到的一些小问题

    1 在spring整合hibernate开发的时候,在数据源里面配置show_sql为true,但是在实际查询的时候并没有打印sql语句,正确的解决方案为: 把<prop key="s ...

  4. python获取指定时间段内的随机不重复的时间点

    上篇 <python时间时分秒与秒数的互相转换>http://www.cnblogs.com/gayhub/p/6154707.html 提到了把时间转成秒数的方法, 这篇写写转换成秒数后 ...

  5. java 终端练习

    Java第一天笔记 一.Window中常见的dos命令 在哪里操作dos命令: Win7 ---> 开始  ---->所有程序--->附件---->命令提示符 Win7--&g ...

  6. jquery实现css3动画

    jquery animate改变元素样式时,只支持数字值的变化,比如width,height等,但是css3属性状态值很多都不是数字值,而是字符串和数字混合在一起,比如translate(), rot ...

  7. 几款Z2760平板对比

    现阶段的Windows平板本质上分为Windows RT系统平板和完整的Windows 8系统平板两大阵营.RT系统的平板轻薄续航持久,但是由于没法安装常规的.exe程序,所以对于工作需要略显不足,是 ...

  8. deProto原型设计工具

    现有的原型工具,比如axure rp等等,都或多或少存在一些使用比较复杂的问题.以至于常常属于少数的产品经理的技能型工具. 在业余的时候,自己凭借兴趣开发了这个工具.希望能够以更简便的方法制作一个de ...

  9. xamarin.forms 版本自动更新(针对android)

    1.首先同过url地址下载文件,这里必须要启用单独一个下载线程 new Thread(run).Start(); 通过url下载的方法 public void run()        {       ...

  10. SQlServer第一天

    SQLserver是个什么东西?相当于一是个货仓,在计算机领域的货仓,学名:数据库. 数据库是个什么东西呢?是指长期存储在计算机内的.有组织.可共享的数据结合.由此可知数据库的三个特点:永久存储.有组 ...