Cookiecutter 使用
1.需求
①make
②gcc 4.7以上
③python2.7
应用于Linux/Unix 或者OS X 系统
2.安装
①减压缩
②git clone http://github.com/ad3002/Cookiecutter.git
cd Cookiecutter/src
make
sudo make install
没有root 用以下:
PREFIX=/my/dir make install
下图,,详细

3.如何使用
①remove 给Kmer库,输出没有匹配上Kmer的reads
②rm_reads 是remove的一个扩展。另外提供了通过(C)n /(G)n轨道或未知核苷酸,读取长度或低序列复杂性的存在来过滤读数的选项,并输出过滤和未过滤的读数;。
③extract 给定Kmer库, 输出匹配到Kmer的reads
④separate 给定Kmer库,输出匹配以及没匹配上的reads,生成2个文件
So. 如何建立一个Kmer库吶。。。。。。。
① 它可以使用cookiecutter make_library从FASTA文件创建。 例如,命令
cookiecutter make_library -i adapters.fa -o adapters.txt -l 5
将从FASTA文件adapters.fa创建长度为5 bp的k-mers文件adapters.txt。
②如果要从大型数据集创建库,或者计算机上的内存有限,可以使用Jellyfish 2进行快速k-mer计算,并使用以下命令:
jellyfish count -m 23 -s 2G -t 4 --text -o kmer_library.dat yourdata.fastq 可以翻看以前的关于jellfish随笔。。。。。。。。
下面。。。。如何操作。。首先假定有一个Kmer库-----adapters.txt
Removing reads by k-mers
Kmer库,single_end reads 文件--raw_data.fastq,用以下命令,输入没匹配上reads,
cookiecutter remove -i raw_data.fastq -f adapters.txt -o filtered,
Extracting reads by k-mers
Kmer库,single_end reads 文件--raw_data.fastq,用以下命令,输入匹配上reads,
cookiecutter extract -i raw_data.fastq -f adapters.txt -o filtered
Advanced read filtration
假如有两个paired-end reads fastq文件,data_1.fastq and raw_data_2.fastq。除了对Kmer可以进行过滤外,还可以通过下面的标准对reads进行过滤:
read长度,(G)n or (C)n 存在,序列复杂性((DUST)以及未知核酸, rm_reads是个不错的选择,命令如下: cookiecutter rm_reads -1 raw_data_1.fastq -2 raw_data_2.fastq -f adapters.txt -o output_dir --polygc 13 --length 50 --dust --filterN
因为有两个pair 问价,所以输出文件也必须是对应关系的。read pairs 只有在两个paire-end read 都过滤才输出, 若一个不满足,则不满足的reads输出一个结尾为.se.astq的文件
Read separation
假如有两个paired-end reads fastq文件,data_1.fastq and raw_data_2.fastq。将Kmer库中与之匹配以及未匹配的reads分别输出到两个文件中。
cookiecutter separate -1 raw_data_1.fastq -2 raw_data_2.fastq
-f adapters.txt -o output_dir
Processing multiple input files
Cookiecutter 支持并行运行多个文件,用-1, -2 或者-i 表示 。。 下面例子:
同样也可以输入FASTA文件,,
关注下方公众号可获得更多精彩
详情:https://github.com/ad3002/Cookiecutter/blob/master/README.md
Cookiecutter 使用的更多相关文章
- Cookiecutter: 更好的项目模板工具:(3)高级用法
本文中的Hook就是钩子,钩子就是Hook 使用生成前/生成后钩子脚本 你可以在项目生成之前和/或之后运行Python或Shell脚本. 像这样把它们放进Hook里: cookiecutter-som ...
- Cookiecutter: 更好的项目模板工具:(2)安装及基础使用
安装 通过python包管理工具 命令行输入 $pip install cookiecutter 或者 # mac os经常会禁止用户全局安装python包 $pip install --user c ...
- Cookiecutter: 更好的项目模板工具:(1)简介及可用资源汇总
原文档地址:https://cookiecutter.readthedocs.io/en/latest/ 本系列只介绍cookiecutter的基础使用,而且会删除与功能使用无关的部分.深度使用及了解 ...
- BitAdminCore框架应用篇:(一)使用Cookiecutter创建应用项目
框架演示:http://bit.bitdao.cn 框架源码:https://github.com/chenyinxin/cookiecutter-bitadmin-core 一.简介 1.Coo ...
- cookiecutter
1.安装cookiecutter pip3 install cookiecutter 2.设置模板 https://github.com/cookiecutter/cookiecutter 搜索需 ...
- 使用cookiecutter创建django项目
使用cookiecutter创建django项目 下载安装: pip install cookiecutter cookiecutter https://github.com/pydanny/cook ...
- 【amad】cookiecutter -- 一个命令行工具,使用项目模版来构建项目
动机 简介 个人评分 动机 一般的框架都有脚手架工具,但是并不会让所有人满意. 简介 cookiecutter1是一个Python实现的命令行工具,可以通过项目模版来构建项目. 它的特性包括: 跨平台 ...
- Python 资源大全中文版
Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理.awesome-python 是 vinta 发起维护的 Python 资源列 ...
- Python资源大全
The Python Tutorial (Python 2.7.11) 的中文翻译版本.Python Tutorial 为初学 Python 必备官方教程,本教程适用于 Python 2.7.X 系列 ...
随机推荐
- Gym 101981J - Prime Game - [数学题][线性筛+分解质因数][2018-2019 ACM-ICPC Asia Nanjing Regional Contest Problem J]
题目链接:http://codeforces.com/gym/101981/attachments 题意: 令 $mul(l,r) = \prod_{i=l}^{r}a_i$,且 $fac(l,r)$ ...
- [redis] <<The little Redis book>>的读书笔记
<<The Little Redis Book>> 请右键点击在新窗口打开,可按原始大小查看.
- nodejs构建mock数据
Nodejs构建mock数据并通过rest api风格调用接口访问数据 如果我们只有json格式的数据文件,我们想通过访问url方式调用居然数据 确保电脑安装node环境 如果你没有安装好node环境 ...
- bugfree3.0.1-导入excel测试用例
大多数项目里只用BugFree做缺陷管理工具,其实还可以通过该工具导入测试用例,记录测试结果,最后获得统计结果. 难点 1.导入文件要求XML格式: 2.一般我们的测试用例都是用excle文件存取,很 ...
- NIO学习资料
五大IO模型 https://jiges.github.io/2018/02/07/%E4%BA%94%E5%A4%A7IO%E6%A8%A1%E5%9E%8B/ Getting started wi ...
- 对象缓冲池 ( cc.pool ) :
对象缓冲池 ( cc.pool ) : 作用 : 优化创建效率 , 尤其是针对需要多次创建的情况 . 缓冲池 API : 缓冲池 ( cc.pool ) 提供的函数并不多 , 只有5个 . cc.po ...
- mysql 游标嵌套
BEGIN -- 开始存储过程 declare my_ID varchar(32); -- 线路iddeclare my_SpecialLineName varchar(50); -- 线路名称 de ...
- 一:window环境,LaTex快速安装(简单易懂)
一. 下载 清华开源软件镜像:点我下载 在线安装很容易失败,所以咱们选择ISO的~ 二. 安装 解压texlive2018.iso文件,并使用管理员权限打开install-tl-windo ...
- haier周的计算原则
现使用oracle的sql表示出haier周, 经过对其生成结果的分析,发现海尔周是以周日到周六分别作为一周的始末, 用到的oracle sql中会涉及到calendar week的定义,还涉及到了I ...
- python多线程学习二
本文希望达到的目标: 多线程同步原语:互斥锁 多线程队列queue 线程池threadpool 一.多线程同步原语:互斥锁 在多线程代码中,总有一些特定的函数或者代码块不应该被多个线程同时执行,通常包 ...