ChIP-seq 学习内容
- chip-seq
- 流程图
- 书籍资料
- 工具
- UCSU
- 安装
- 使用
- 原理
- 手册
- Swiss在线分析工具
- 短序列比对工具
- BWA
- 流程
- 格式处理
- 序列比对
- peak-calling
- motif
- 可视化
- 输出文档
- 上下游分析
chip-seq
流程图
【怪毛匠子】
【独家整理-怪毛匠子】
书籍资料
生物信息学 许忠能
生物信息学——计算的视角 李岭 译
工具
UCSU
安装
获得源文件 http://liulab.dfci.harvard.edu/MACS/Download.html MACS-1.4.2-1.tar.gz http://github.com/downloads/taoliu/MACS/MACS-1.4.2-1.tar.gz 解压缩文件生成MACS-1.4.2文件夹 tar xvzf MACS-1.4.2-1.tar.gz cd MACS-1.4.2 python setup.py install –prefix /your_directory/ prefix用于指定安装目录 修改环境变量:(使用sudo可以不用设置环境变量。。。) export PATH = /your_directory/bin:$PATH export PYTHONPATH = /your_directory/lib/python2.X/site-packages/:$PYTHONPATH 使用命令macs14 -h 验证并查看macs的使用说明
使用
假设我们现在有mouse的一组CTCF的ChIP-seq测序数据CTCF.fastq,首先,我们把这些reads map到mouse基因组(这里我们采用mm10)上。假设基因组的index文件已经建好,存在/path_to/文件夹下。
bowtie –m 1 -S -q /path_to/mm10 CTCF.fastq CTCF.sam
-m 最终只保留map上一次的reads
-S 输出文件格式是SAM
-q 输入文件格式是fastq
peak-callingmacs 14 -t CTCF.sam -n CTCF –g mm-t
实验组数据文件名(相对对照组control而言,后面会进一步说明)-n 输出文件名前缀
-g 基因组的大致大小,-g number。MACS内置了一些基因组长度,“mm”表示小鼠的,“hs”表示人的,“ce”表示线虫,“dm”是果蝇。
运行成功后,将得到如下文件:
CTCF_model.r,CTCF_peaks.bed,CTCF_peaks.xls,CTCF_summits.bed
其中,CTCF_model.r以代码的形式保存了“双峰模型”。在终端中输入:
Rscript CTCF_model.r
原理
手册
Swiss在线分析工具
http://ccg.vital-it.ch/chipseq/
短序列比对工具
soap 针对single-end
maq
bwa
Bowtie 速度很快 chipseq适用
BWA
- 下载地址
http://bio-bwa.sourceforge.net/bwa.shtml
- 步骤
第一步: 建立 Index
根据reference genome data(e.g. reference.fa) 建立 Index File
[root@localhost ]# bwa index -a bwtsw human_hg18_ref.fa(human参考基因组18)
第二步: 寻找 SA coordinates
如果是pair-end 数据(leftRead.fastq和rightRead.fastq)两个文件分别处理
1 bwa aln reference.fa leftRead.fastq > leftRead.sai
2 bwa aln reference.fa rightRead.fastq > rightRead.sai
3 bwa aln reference.fa singleRead.fastq > singleRead.sai
如果希望多线程运行,在其中加入 -t这个参数,另外-f这个参数可以指定结果输出文件,如:
1 bwa aln -c -t 3 -f leftreads.sai reference.fa leftreads.fastq
第三步:转换SA coordinates输出为sam
如果是pair-end数据
1 bwa sampe -f pair-end.sam reference.fa leftRead.sai rightRead.sai leftRead.fastq rightread.fastq
如果是single reads数据
1 bwa samse -f single.sam reference.fa single.sai single.fastq
流程
格式处理
格式:fastq
工具:FASTQ Groomer、samtools
序列比对
工具:bowtie 输入:fastq 输出:SAM/BAM
peak-calling
工具:MACS(peak-calling) 输入:mapped reads 输出:peaks(BED)、report(html)【】 参数: 链接:
motif
http://blog.163.com/zju_whw/blog/static/225753129201532104815301/
motif分为两种:
1.Consensus(共识序列),这种就是有序列或是说字母表示,如果同时出现“A”和“G”就用“R”表示,具体是根据IUPAC code(International Union of Pure and Applied Chemistry,http://www.bioinformatics.org/sms2/iupac.html
2.Matrix-based(矩阵方法),就是利用矩阵将每个位置的A,G,C,T的量都表示出来。该方法又有三种变化,Count-matrix,PFM(position frequency matrix)和PWM(position weight scoring)。Count matirx是每个位置计数得来的,PFM是每个位置的百分比得来的,而PWM是通过取对数得来的。
1. 工具:Homer(motif富集的几何优化)
输入:
输出:
参数:
链接:http://homer.salk.edu/homer/
download:http://homer.salk.edu/homer/configureHomer.pl
http://blog.163.com/zju_whw/blog/static/225753129201532104815301/
- 工具:RAST(RSA-Tools)
http://floresta.eead.csic.es/rsat/peak-motifs_form.cgi
http://floresta.eead.csic.es/rsat/RSAT_home.cgi
可视化
- 峰图可视化
UCSC
GREAT
输入:BED文件
http://bejerano.stanford.edu/great/public/html/
motif分析工具
输出文档
图、质量参数、FDR、
上下游分析
ChIP-seq 学习内容的更多相关文章
- web前端开发学习内容
应该 具备的 知识技能 :懂web标准,熟练手写 xhtml css3 并符合 符合w3c标准 代码能 兼容主流浏览器.ie6.7.8.9 ff 等. ...
- STM32学习内容和计划
一.STM32学习内容(流程) 1.学习STM32开发流程 ①MDK使用.建立工程.调试等 ②库开发方法 2.学习STM32常用外设开发 ①GPIO ②中断 ③定时器 ④串口 ⑤CAN 3.学习STM ...
- u-boot代码学习内容
前言 u-boot代码庞大,不可能全部细读,只能有选择的读部分代码.在读代码之前,根据韦东山教材,关于代码学习内容和深度做以下预先划定. 一.Makefile.mkconfig.config.mk等 ...
- 2.Freshman阶段学习内容的确定
我刷知乎.在知乎上答题的程序员,不是很牛逼就是更牛逼,说起各种系统.各种系统的各种版本.各种语言.数据库.算法.IT届的各种圣战都有板有眼.信手拈来.头头是道,不得不服.这导致了一些非常严重的问题:我 ...
- 20155209 2016-2017-2 《Java程序设计》第九周学习总结 ## 教材学习内容总结
教材学习内容总结 JDBC API 允许用户访问任何形式的表格数据,尤其是存储在关系数据库中的数据. 执行流程: •连接数据源,如:数据库. •为数据库传递查询和更新指令. •处理数据库响应并返回的结 ...
- JAVA第十周《网络编程》学习内容总结
JAVA第十周<网络编程>学习内容总结 学习内容总结 1.初听到网络编程四个字可能会觉得很困难,实际上网络编程就是在两个或两个以上的设备(例如计算机)之间传输数据,把数据发送到指定的位置, ...
- # 20145118 《Java程序设计》第4周学习总结 ## 教材学习内容总结
20145118 <Java程序设计>第4周学习总结 教材学习内容总结 本周内容为教材第六.七两张内容. 重点概念: 1.面向对象中,子类继承父类,避免重复的行为定义,是一种简化操作. 2 ...
- 20145118 《Java程序设计》第5周学习总结 教材学习内容总结
20145118 <Java程序设计>第5周学习总结 教材学习内容总结 1.Java中所有错误都会被打包成对象,可以通过try.catch语法对错误对象作处理,先执行try,如果出错则跳出 ...
- 20155328 2016-2017-2 《Java程序设计》 第十周学习内容总结
20155328 2016-2017-2 <Java程序设计>第十周学习总结 教材学习内容总结 JAVA和ANDROID开发学习指南 第22章 网络概览 两台计算机用于通信的语言叫做&qu ...
- spring boot(10) 基础学习内容
A Spring boot(10) 基础学习内容 B SpringBoot(16) 基础学习内容
随机推荐
- 写Java代码分别使堆溢出,栈溢出
首先要搞清楚堆栈里放的什么东西: 栈存储运行时声明的变量——对象引用(或基础类型, primitive)内存空间,堆分配每一个对象内容(实例)内存空间. 一个变量可以先后指向多个对象实例:数组.链表等 ...
- Docker bridge-utils 工具简单部署
bridge-utils 网桥查看工具 # 1.安装 查看桥接工具 yum install -y bridge-utils # 2.查看桥接 命令brctl show bridge name brid ...
- Mysql 数据库介绍
数据库介绍 数据库(Database)是按照数据结构来组织.存储和管理数据的仓库,每个数据库都有一个或多个不同的API接口用于创建,访问,管理,搜索和复制所保存的数据. 我们也可以将数据存储在文件中, ...
- Shell 脚本格式注意事项
if 条件判断格式 if [ ! -f file.txt ];then cmd else cmd fi 注1:! 代表非.不存在文件就成功. 注2:再有参数 变量 需要 [] 阔起 1 运算书写写格式 ...
- 修改mongodb(带仲裁节点的副本集)各机器端口
需求:因为端口调整,需要改变副本的备份集 1.查看当前的副本集信息 [root@localhost bin]# ./mongo 192.168.1.134:10001 repltest:PRIMARY ...
- elasticsearch 索引备份恢复
备份脚本 es_backup.sh : #!/bin/bash#备份昨天数据,删除30天前索引 host=`hostname`address="xxx@xxx.com" es_us ...
- opencv学习之路(30)、分水岭算法及图像修补
一.简介 二.分水岭算法 #include "opencv2/opencv.hpp" using namespace cv; void main() { Mat srcImg = ...
- Bugku-CTF之你必须让他停下+头等舱
Day8 你必须让他停下 地址:http://123.206.87.240:8002/web12/ 访问之后发现:
- Codeforces 979E Kuro and Topological Parity - 动态规划 - 组合数学
题目传送门 传送点 题目大意 给定$n$个标号依次为$1, 2, \cdots, n$的点,其中一些点被染成一些颜色,剩下的点没有染色.你需要添加一些有向边并将剩下的点染色,满足有向边从编号小的一端指 ...
- Linux内核 kmalloc, kzalloc & devm_kzalloc 区别【转】
本文转载自:https://blog.csdn.net/u014628531/article/details/50711409 首先,kzalloc()实现了kmalloc()+memset()的功能 ...