circos pipeline

# /usr/bin/env python
# coding=utf-8
###################################
#  Author : yunkeli
#  Version : 1.0(2015/6/20)
#  E-mail : 1316014512@qq.com
###################################
import os
import argparse
import re
import random
def vcf_SNPdensity(snpvcffile,pathway):
   print "this step is vcf to SNPdensity "
   cmdvcftorate = "/home/liyunke/vcftools_0.1.12b/bin/vcftools --vcf "+snpvcffile+" --out " + pathway+"/SNPdensity100K --SNPdensity 1000000"
   result_analysis=os.popen(cmdvcftorate)
   print result_analysis.read()
def density(SNPdensityfile,pathway):
   print "##############################"
   print "this step is vcf to densitysplit cat "
   fileopen = open(SNPdensityfile).readlines()[1:]
   savename = pathway+"/"+"SNPdensity50K.snpden.new.txt"
   filesave = open(savename,"w+")
   for i in fileopen:
      listi = i.split()
      filesave.write(listi[0].replace("chr","hs")+"\t"+listi[1]+"\t"+str(int(listi[1])+999999)+"\t"+str(float(listi[3])/10)+"\n")
   filesave.close()
def densitysplit(SNPdensityfile,pathway):
   print "##############################"
   print "this step is vcf to densitysplit "
   fileopen = open(SNPdensityfile).readlines()[1:]
   namelist = []
   for i in fileopen:
      if i.split()[0] not in namelist:
         namelist.append(i.split()[0])
   for j in namelist:
      savename = pathway+"/"+j.replace("chr","hs")+".snp.txt"
      filesave = open(savename,"w+")
      for x in fileopen:
         listx = x.split()
         if listx[0] == j:
            filesave.write(listx[0].replace("chr","hs")+"\t"+listx[1]+"\t"+str(int(listx[1])+499999)+"\t"+listx[3]+"\n")
      filesave.close()
   print "densitysplit ok"
def sv_split(svdensityfile,pathway):
   print "##############################"
   print "this step is vcf to sv_file split "
   fileopen = open(svdensityfile).readlines()[1:]
   namelist = []
   for i in fileopen:
      if i.split()[0] not in namelist:
         namelist.append(i.split()[0])
   for j in namelist:
      listrandom = []
      savename = pathway+"/"+j.replace("chr","hs")+".sv.txt"
      filesave = open(savename,"w+")
      for x in fileopen:
         listx = x.split()
         if listx[0] == j:
            if listx[0] != listx[5]:
               listrandom.append(x)
      if len(listrandom) > 10:
         slicelist = random.sample(listrandom, 10)
         for links in slicelist:
            listlinks = links.split()
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[0:3]).replace("chr","hs")+"\n")
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[5:8]).replace("chr","hs")+"\n")
         filesave.close()
      else:
         for links in listrandom:
            listlinks = links.split()
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[0:3])+"\n")
            filesave.write("segdups"+str(listrandom.index(links))+"\t"+"\t".join(listlinks[5:8])+"\n")
         filesave.close()
def circos_config(npath,prefix):
   oldconfig = "/home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/config"
   configopen = open(oldconfig).read()
   f1 = re.sub("pathway",npath,configopen)
   newconfig = "/home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/"+prefix+".conf"
   newconfigsave = open(newconfig,"w+")
   newconfigsave.write(f1)
   newconfigsave.close()
def main():
   p = argparse.ArgumentParser(usage='./circos.pipline.py [--vcf] [--sv] [--prefix] [--outdir] ', description='circos snp sv')  
   p.add_argument('-v','--vcf', type=str, help='vcf file')  
   p.add_argument('-s','--sv',  type=str, help='sv file')
   p.add_argument('-p','--prefix', default="circostest",help='prefix or usrname')
   p.add_argument('-o','--outdir', default="./", help='document directory')
   args = p.parse_args()
   prefix = args.prefix
   vcffile = args.vcf
   outdir = args.outdir
   vcf_SNPdensity(vcffile,outdir)
   SNPdensityfile = outdir+"/SNPdensity100K.snpden"
   density(SNPdensityfile,outdir)
   densitysplit(SNPdensityfile,outdir)
   svdensityfile = args.sv
   sv_split(svdensityfile,outdir)
   circos_config(outdir,prefix)
   cmdstr = "/home/liyunke/circos/sof/circos-0.67-7/bin/circos  -conf /home/liyunke/circos/sof/circos-0.67-7/work/pipeline/etc/"+prefix+".conf --outputdir "+ outdir+" -outputfile "+prefix
   result_analysis_circos =os.popen(cmdstr)
   print result_analysis_circos.read()
   rmcmd = "rm "+ outdir +"/hs*"
   result_analysis_rm =os.popen(rmcmd)
   print result_analysis_rm.read()
if __name__ == '__main__':
   main()

circos pipeline的更多相关文章

redis大幅性能提升之使用管道（PipeLine）和批量（Batch）操作
前段时间在做用户画像的时候,遇到了这样的一个问题,记录某一个商品的用户购买群,刚好这种需求就可以用到Redis中的Set,key作为productID,value 就是具体的customerid集合, ...
Building the Testing Pipeline
This essay is a part of my knowledge sharing session slides which are shared for development and qua ...
Scrapy:为spider指定pipeline
当一个Scrapy项目中有多个spider去爬取多个网站时,往往需要多个pipeline,这时就需要为每个spider指定其对应的pipeline. [通过程序来运行spider],可以通过修改配置s ...
图解Netty之Pipeline、channel、Context之间的数据流向。
声明:本文为原创博文,禁止转载. 以下所绘制图形均基于Netty4.0.28版本. 一.connect(outbound类型事件) 当用户调用channel的connect时,会发起一个 ...
初识pipeline
1.pipeline的产生从一个现象说起,有一家咖啡吧生意特别好,每天来的客人络绎不绝,客人A来到柜台,客人B紧随其后,客人C排在客人B后面,客人D排在客人C后面,客人E排在客人D后面,一直排到店面 ...
MongoDB 聚合管道（Aggregation Pipeline）
管道概念 POSIX多线程的使用方式中, 有一种很重要的方式-----流水线(亦称为"管道")方式,"数据元素"流串行地被一组线程按顺序执行.它的使用架构可参考 ...
SSIS Data Flow 的 Execution Tree 和 Data Pipeline
一,Execution Tree 执行树是数据流组件(转换和适配器)基于同步关系所建立的逻辑分组,每一个分组都是一个执行树的开始和结束,也可以将执行树理解为一个缓冲区的开始和结束,即缓冲区的整个生命周 ...
Kafka到Hdfs的数据Pipeline整理
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处找时间总结整理了下数据从Kafka到Hdfs的一些pipeline,如下 1> Kafka ...
SQL Queries from Transactional Plugin Pipeline
Sometimes the LINQ, Query Expressions or Fetch just doesn't give you the ability to quickly query yo ...

随机推荐

spring notes
************************ nexus is a tool of warehouse managementfirst nexus search local warehous ,i ...
手牵手，从零学习Vue源码系列一（前言-目录篇)
系列文章: 手牵手,从零学习Vue源码系列一(前言-目录篇) 手牵手,从零学习Vue源码系列二(变化侦测篇) 手牵手,从零学习Vue源码系列三(虚拟DOM篇) 陆续更新中... 预计八月中旬更新 ...
Python爆火的原因与未来|内附Python学习书籍大礼包无偿领取|
从12年到20年,python以肉眼可见的趋势超过了java,成为了当今It界人人皆知的编程语言. python为什么这么火? 网络编程语言搜索指数适合初学者 Python具有语法简单.语句清晰的特 ...
Alink漫谈(十五) ：多层感知机之迭代优化
Alink漫谈(十五) :多层感知机之迭代优化目录 Alink漫谈(十五) :多层感知机之迭代优化 0x00 摘要 0x01 前文回顾 1.1 基本概念 1.2 误差反向传播算法 1.3 总 ...
C/C++编程笔记：C++入门知识丨类和对象
本篇要学习的内容和知识结构概览类及其实例化类的定义将一组对象的共同特征抽象出来, 从而形成类的概念. 类包括数据成员和成员函数, 不能在类的声明中对数据成员进行初始化声明类形式为: clas ...
QT学习笔记（day01）
QT中的对象树一定程度上简化了内存回收机制:当创建的对象指定的父亲是由QObject或者Object派生的类时候,这个对象被加载到对象树上,当窗口关闭掉时候,树上的对象也都会被释放掉信号和槽通 ...
浅谈树形结构的特性和应用（上）:多叉树，红黑树，堆，Trie树，B树，B+树...
上篇文章我们主要介绍了线性数据结构,本篇233酱带大家康康无所不在的非线性数据结构之一:树形结构的特点和应用. 树形结构,是指:数据元素之间的关系像一颗树的数据结构.我们看图说话: 它具有以下特点: ...
Redis分布式限流器
以下文章来源于微信公众号:程序员内点事 ,作者:程序员内点事请大家关注原作者 1. 什么是限流?为什么要限流? 限流是保证系统高可用的重要手段!!!由于互联网公司的流量巨大,系统上线会做一个流量峰值 ...
03-Thread类中的常用方法
Thread类中的常用的方法: * 1. start():启动当前线程:调用当前线程的run() * 2. run(): 通常需要重写Thread类中的此方法,将创建的线程要执行的操作声明在此方法中 ...
006_go语言中的if else条件语句
代码演示 package main import "fmt" func main() { if 7%2 == 0 { fmt.Println("7 is even&quo ...

circos pipeline

circos pipeline的更多相关文章

随机推荐

热门专题