通过bed文件获取fasta序列
一、BED 文件格式
BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。
必须包含的3列:
1.chrom, 染色体名字(e.g. chr3, chrY)
2.chromStart, 目标区段在染色体起始位置,染色体第一个碱基的位置是0
3.chromEnd, 目标区段在染色体结束位置,染色体的末端位置没有包含到显示信息里面。例如,首先得100个碱基的染色体定义为chromStart =0 . chromEnd=100, 碱基的区段是0-99
9个可选列
4.name、5.score、6.strand、7.thickStart、8.thickEnd、9.itemRGB、10.blockCount、11.blockSize、12.blockStarts
二、基因组文件下载和seqFasta.py相关依赖包下载
1.基因组文件下载,如人hg38
$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz
2.seqFasta.py依赖包下载
$ pip install numpy pyfasta
三、运行脚本seqFasta.py得到结果
1.利用geneInfo.py得到bed文件
$ python geneInfo.py -i brca1 -d hg38 -o brca1.bed
2.运行seqFasta.py得到fasta序列
$ python seqFasta.py -g $HG38/hg38.fa -b brca1.bed
【参考列表】
通过bed文件获取fasta序列的更多相关文章
- 从细菌GFF文件提取CDS序列并转换为氨基酸序列
		
最近在上生物信息学原理,打算记录一些课上的作业.第一次作业:如题. 基本思路: 1.从GFF中读取CDS的起始终止位置以及正负链信息.GFF格式见http://blog.sina.com.cn/s/b ...
 - php 统计fasta 序列长度和GC含量
		
最近php7的消息铺天盖地, 忍不住想尝试下.星期天看了下语法, 写个小脚本练下手: 这个脚本读取fasta 文件, 输出序列的长度和GC含量: <?php $fasta = "tes ...
 - bowtie2-inspect 根据bowtie2的索引取得fasta 序列
		
今天运行tophat2的时候看到下面这条记录: [2016-02-27 11:40:03] Checking for reference FASTA file Warning: Could not f ...
 - samtools faidx 命令处理fasta序列
		
samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列 用法: samtools faidx ...
 - logstash快速入门 (这篇文章很不错 )  |  两种方式往logstash传输数据实例:Apache 日志(从文件获取)、Syslog方式
		
原文地址:http://www.2cto.com/os/201411/352015.html 原文地址:http://logstash.net/docs/1.4.2/tutorials/getting ...
 - 从Excel、CSV文件获取数据
		
#region 从Excel获取数据 /// <summary> /// 从Excel获取数据 /// </summary> /// <param name=" ...
 - [Spark][Python]spark 从 avro 文件获取 Dataframe 的例子
		
[Spark][Python]spark 从 avro 文件获取 Dataframe 的例子 从如下地址获取文件: https://github.com/databricks/spark-avro/r ...
 - matlab下将图片序列转化为视频文件 &&  将为视频文件转化图片序列
		
将图片序列转化为视频文件 程序如下: framesPath = 'E:\img\';%图像序列所在路径,同时要保证图像大小相同 videoName = 'Bolt.avi';%表示将要创建的视频文件的 ...
 - 类型:Ajax;问题:ajax调用ashx参数获取不到;结果:ashx文件获取$.ajax()方法发送的数据
		
ashx文件获取$.ajax()方法发送的数据 今天在使用Jquery的ajax方法发送请求时,发现在后台中使用ashx文件无法接收到ajax方法中传递的参数,上网查了一下原因后发现了问题所在,原来是 ...
 
随机推荐
- 【BZOJ2096】[Poi2010]Pilots 双指针+单调队列
			
[BZOJ2096][Poi2010]Pilots Description Tz又耍畸形了!!他要当飞行员,他拿到了一个飞行员测试难度序列,他设定了一个难度差的最大值,在序列中他想找到一个最长的子串, ...
 - 怎么用cookie解决选项卡问题刷新后怎么保持原来的选项?
			
什么是cookie? Cookies虽然一般都以英文名呈现,但是它还是有一个可爱的中文名“小甜饼”.Cookies是指服务器暂存放在你的电脑里的txt格式的文本文件资料,主要用于网络服务器辨别电脑使用 ...
 - There are two different types of export, named and default
			
export - JavaScript | MDN https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Statemen ...
 - 我的Android进阶之旅------>报 error: Apostrophe not preceded by \  的错误解决办法
			
今天对项目进行国际化翻译的时候控制台出现了以下的错误: res/values/strings.xml:100: error: Apostrophe not preceded by \ (in Sorr ...
 - :style动态设置属性
			
前段时间做页面时需要动态设置背景图片,每一种框架都会遇见类似的需求,特记录下来,以免不时之需: <!DOCTYPE html> <html> <head> < ...
 - Eclipse for PHP Developers使用笔记
			
1 修改字体样式:Window-->Preference-->General-->Appearance-->Basic-->text font-->edit
 - nginx+keepalived简单双机主从热备
			
双机主从热备概述 可以两台机子互为热备,平时各自负责各自的服务.在做上线更新的时候,关闭一台服务器的tomcat后,nginx自动把流量切换到另外一台服务的后备机子上,从而实现无痛更新,保持服务的持续 ...
 - smokeping 出现的问题
			
Global symbol "%Config" requires explicit package name at /usr/lib64/perl5/lib.pm line 10. ...
 - ubuntu gitlab服务器搭建
			
gitlab服务器搭建 1.安装依赖包 sudo apt-get install curl openssh-server ca-certificates postfix 执行完成后,出现邮件配置,选择 ...
 - codeforces 569B B. Inventory(水题)
			
题目链接: B. Inventory time limit per test 1 second memory limit per test 256 megabytes input standard i ...