1.需求

  ①make

  ②gcc 4.7以上

  ③python2.7

 应用于Linux/Unix 或者OS X 系统

2.安装

  ①减压缩

    ②git clone http://github.com/ad3002/Cookiecutter.git
cd Cookiecutter/src
make
sudo make install
  
没有root 用以下:  
PREFIX=/my/dir make install

下图,,详细


3.如何使用
  ①remove  给Kmer库,输出没有匹配上Kmer的reads
  ②rm_reads  是remove的一个扩展。另外提供了通过(C)n /(G)n轨道或未知核苷酸,读取长度或低序列复杂性的存在来过滤读数的选项,并输出过滤和未过滤的读数;。
  ③extract  给定Kmer库, 输出匹配到Kmer的reads
  ④separate  给定Kmer库,输出匹配以及没匹配上的reads,生成2个文件 So. 如何建立一个Kmer库吶。。。。。。。

① 它可以使用cookiecutter make_library从FASTA文件创建。 例如,命令

cookiecutter make_library -i adapters.fa -o adapters.txt -l 5
将从FASTA文件adapters.fa创建长度为5 bp的k-mers文件adapters.txt。

②如果要从大型数据集创建库,或者计算机上的内存有限,可以使用Jellyfish 2进行快速k-mer计算,并使用以下命令:

jellyfish count -m 23 -s 2G -t 4 --text -o kmer_library.dat yourdata.fastq                      可以翻看以前的关于jellfish随笔。。。。。。。。

下面。。。。如何操作。。首先假定有一个Kmer库-----adapters.txt

Removing reads by k-mers

Kmer库,single_end reads 文件--raw_data.fastq,用以下命令,输入没匹配上reads,

    cookiecutter remove -i raw_data.fastq -f adapters.txt -o filtered,

Extracting reads by k-mers

Kmer库,single_end reads 文件--raw_data.fastq,用以下命令,输入匹配上reads,

cookiecutter extract -i raw_data.fastq -f adapters.txt -o filtered

Advanced read filtration

假如有两个paired-end reads fastq文件,data_1.fastq and raw_data_2.fastq。除了对Kmer可以进行过滤外,还可以通过下面的标准对reads进行过滤:

read长度,(G)n or (C)n 存在,序列复杂性((DUST)以及未知核酸, rm_reads是个不错的选择,命令如下:                                                                                                                         cookiecutter rm_reads -1 raw_data_1.fastq -2 raw_data_2.fastq  -f adapters.txt -o output_dir --polygc 13 --length 50  --dust --filterN

因为有两个pair 问价,所以输出文件也必须是对应关系的。read pairs 只有在两个paire-end read 都过滤才输出,  若一个不满足,则不满足的reads输出一个结尾为.se.astq的文件

Read separation

假如有两个paired-end reads fastq文件,data_1.fastq and raw_data_2.fastq。将Kmer库中与之匹配以及未匹配的reads分别输出到两个文件中。

cookiecutter separate -1 raw_data_1.fastq -2 raw_data_2.fastq -f adapters.txt -o output_dir

Processing multiple input files

Cookiecutter 支持并行运行多个文件,用-1, -2 或者-i 表示 。。  下面例子:
    

同样也可以输入FASTA文件,,

  

关注下方公众号可获得更多精彩

详情:https://github.com/ad3002/Cookiecutter/blob/master/README.md

Cookiecutter 使用的更多相关文章

  1. Cookiecutter: 更好的项目模板工具:(3)高级用法

    本文中的Hook就是钩子,钩子就是Hook 使用生成前/生成后钩子脚本 你可以在项目生成之前和/或之后运行Python或Shell脚本. 像这样把它们放进Hook里: cookiecutter-som ...

  2. Cookiecutter: 更好的项目模板工具:(2)安装及基础使用

    安装 通过python包管理工具 命令行输入 $pip install cookiecutter 或者 # mac os经常会禁止用户全局安装python包 $pip install --user c ...

  3. Cookiecutter: 更好的项目模板工具:(1)简介及可用资源汇总

    原文档地址:https://cookiecutter.readthedocs.io/en/latest/ 本系列只介绍cookiecutter的基础使用,而且会删除与功能使用无关的部分.深度使用及了解 ...

  4. BitAdminCore框架应用篇:(一)使用Cookiecutter创建应用项目

      框架演示:http://bit.bitdao.cn 框架源码:https://github.com/chenyinxin/cookiecutter-bitadmin-core 一.简介 1.Coo ...

  5. cookiecutter

    1.安装cookiecutter pip3 install cookiecutter 2.设置模板 https://github.com/cookiecutter/cookiecutter   搜索需 ...

  6. 使用cookiecutter创建django项目

    使用cookiecutter创建django项目 下载安装: pip install cookiecutter cookiecutter https://github.com/pydanny/cook ...

  7. 【amad】cookiecutter -- 一个命令行工具,使用项目模版来构建项目

    动机 简介 个人评分 动机 一般的框架都有脚手架工具,但是并不会让所有人满意. 简介 cookiecutter1是一个Python实现的命令行工具,可以通过项目模版来构建项目. 它的特性包括: 跨平台 ...

  8. Python 资源大全中文版

    Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理.awesome-python 是 vinta 发起维护的 Python 资源列 ...

  9. Python资源大全

    The Python Tutorial (Python 2.7.11) 的中文翻译版本.Python Tutorial 为初学 Python 必备官方教程,本教程适用于 Python 2.7.X 系列 ...

随机推荐

  1. Gym 101194E / UVALive 7901 - Ice Cream Tower - [数学+long double][2016 EC-Final Problem E]

    题目链接: http://codeforces.com/gym/101194/attachments https://icpcarchive.ecs.baylor.edu/index.php?opti ...

  2. ES6 Class 类

    在ES6中,class (类)作为对象的模板被引入,可以通过 class 关键字定义类. class 的本质是 function. 它可以看作一个语法糖,让对象原型的写法更加清晰.更像面向对象编程的语 ...

  3. ES6 数值

    数值的表示 二进制表示法新写法: 前缀 0b 或 0B . console.log(0b11 === 3); // true console.log(0B11 === 3); // true 八进制表 ...

  4. iOS 如果页面 A 跳转到 页面 B,A 的 viewDidDisappear 方法和 B 的 viewDidAppear 方法哪个先调用?

    如果页面 A 跳转到 页面 B,A 的 viewDidDisappear 方法和 B 的 viewDidAppear 方法哪个先调用? 1. - (void)pushViewController:(U ...

  5. Python四线程爬取西刺代理

    import requests from bs4 import BeautifulSoup import lxml import telnetlib #验证代理的可用性 import pymysql. ...

  6. MySQL Backup mydumper

    生产环境中有一实例每天使用mysqldump备份时长达到了2个小时53分钟,接近3个小时,还不算上备份文件归档的时间,这个时间对于逻辑备份来说有点久.为了提高逻辑备份效率,打算替换为使用mydumpe ...

  7. cocos2d JS-(JavaScript) 冒泡排序

    思想: 比较相邻的元素.如果第一个比第二个大,就交换他们两个. 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对.在这一点,最后的元素应该会是最大的数. 针对所有的元素重复以上的步骤,除了最 ...

  8. fiddler学习总结--autoresponder替换资源

    意义:替换服务器返回的内容 1.找到需要替换的目标 2.选择目标后,点击“autoresponder”-->”add  rules” 3.在下图中,选择“find a file”,再选择需要替换 ...

  9. Install rapyuta Robot Cloud Engine on Ubuntu14.04

    # -Rapyuta-installation-in-Ubuntu14.04-LTS-Trusty-This gzip folder is a tested version which can ins ...

  10. python locust 性能测试:locsut参数化-保证并发测试数据唯一性,不循环取数据

    from locust import TaskSet, task, HttpLocustimport queue class UserBehavior(TaskSet): @task def test ...