本文转载于https://mp.weixin.qq.com/s?__biz=MzIxNzEzODA5NQ==&mid=2649373408&idx=1&sn=232c2cb36dfde647a5c1f5103d213ddd&chksm=8fe0cc20b897453613450906548a7344d17b3a850be9103cb33b58b0c521212c81de1750e160&mpshare=1&scene=23&srcid=0619cPVePyZ7ifZDQwcCQByc#rd

为了确定潜在新种的分类地位,自然要下载诸多模式种的16S rDNA序列来构建系统发育树,一株一株的手动下载,好累!一个python脚本,可以从LPSN(http://www.bacterio.net/)下载指定属下所有模式种的16S rDNA序列,解放你的双手。

我们先来看一下脚本的参数:

-h显示帮助信息;

-i 指定查询的属名,要求在LPSN中存在;

-l 本脚本输出的log文件,接下来会有详细介绍;

-o 指定输出的文件夹路径,如果文件夹不存在会自动创建。

脚本可以接受的输入包括两种方式:

(1)-i参数指定的属名,脚本会通过查询LPSN获取该属下的所有模式种信息,包括属种名,模式种编号,NCBI登录号,并将这些信息写入“属名.xls“文件中。然后通过NCBI的登录号前往NCBI下载该模式种的16SrDNA序列,并写入“属名.fa“文件中,同时将下载失败的模式种信息写入”属名.log“文件中。

(2)本程序生成的”属名.log”文件可以通过-l参数作为输入,脚本会再次尝试下载log中记录的下载失败的模式种。

需要注意的是,LPSN中给出的某些模式种的NCBI登录号为该模式种的全基因组序列,对于这种情况,脚本不会将序列写入“属名.fa“文件。下面是下载示例:

下载完成后会给出一个下载统计报告:

下载速度与网速和模式种个数有关,请耐心等待,另外,NCBI白天的连接速度要好于晚上,不知道这是否是个玄学问题,所以建议白天下载,如果遇到长时间(5分钟)界面无反应的情况可以尝试中断然后重新下载。

LPSN获取菌python脚本的更多相关文章

  1. 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本

    摘自:http://blog.csdn.net/forandever/article/details/5711319 一个获取指定目录下一定格式的文件名称和文件修改时间并保存为文件的python脚本 ...

  2. Python脚本控制的WebDriver 常用操作 <十九> 获取测试对象的状态

    下面将使用webdriver来模拟测试中观察测试对象的状态的操作 测试用例场景 在web自动化测试中,我们需要获取测试对象的四种状态 是否显示.使用element.is_displayed()方法: ...

  3. Python脚本控制的WebDriver 常用操作 <十七> 获取测试对象的属性及内容

    测试用例场景 获取测试对象的内容是前端自动化测试里一定会使用到的技术.比如我们要判断页面上是否显示了一个提示,那么我们就需要找到这个提示对象,然后获取其中的文字,再跟我们的预期进行比较.在webdri ...

  4. 获取上海地区AQI质量数据Python脚本

    一个获取上海地区AQI质量的Python脚本 https://github.com/yanyueoo7/Raspberrypi/blob/master/GetPmData_Shanghai.py #! ...

  5. python脚本获取本机公网ip

    1.获取公网IP地址方式,访问:http://txt.go.sohu.com/ip/soip 2.python脚本实现: #!/usr/bin/python # -*- coding:utf8 -*- ...

  6. Java调用Python脚本并获取返回值

    在Java程序中有时需要调用Python的程序,这时可以使用一般的PyFunction来调用python的函数并获得返回值,但是采用这种方法有可能出现一些莫名其妙的错误,比如ImportError.在 ...

  7. Python脚本控制的WebDriver 常用操作 <十八> 获取测试对象的css属性

    测试用例场景 当你的测试用例纠结细枝末节的时候,你就需要通过判断元素的css属性来验证你的操作是否达到了预期的效果.比如你可以通过判断页面上的标题字号以字体来验证页面的显示是否符合预期.当然,这个是强 ...

  8. 获取kafka的lag, offset, logsize的shell和python脚本

    python脚本 #!/usr/bin/env python import os import re import sys group_id=sys.argv[1] pn=sys.argv[2] ka ...

  9. python学习 —— 获取系统运行情况信息并在Linux下设置定时运行python脚本

    代码: # -*- coding:utf-8 -*- from psutil import * def cpu_usage_rate(): for i, j in zip(range(1, cpu_c ...

随机推荐

  1. bzoj2035: [2009国家集训队]数据读取问题

    Description Input Output 可以转为边权为1的最短路:将不修改并读取x个数看作有向边,原先树上的边仍保留且视为双向边(但从根出发的边为单向)表示上次读取的修改 第一种边是点到bf ...

  2. 杂项:BugFree

    ylbtech-杂项:BugFree BugFree是借鉴微软的研发流程和Bug管理理念,使用PHP+MySQL独立写出的一个Bug管理系统.简单实用.免费并且开放源代码(遵循GNU GPL). 命名 ...

  3. [.net]webform 版本冲突

    ASP.NET Web Pages版本问题 调试后浏览器提示: 检测到 ASP.NET Web Pages 的冲突版本: 指定的版本为“1.0.0.0”,而 bin 中的版本为“2.0.0.0”.要继 ...

  4. shell 1基础

    shell简介 shell是一个用C语言编写的程序,是用户使用Linux的桥梁.shell既是一种命令语言,又是一种程序设计语言. shell脚本(shell script),是一种为shell编写的 ...

  5. REST-assured 3发送图片

    上传图片,需要media_id,从上传临时素材获取:https://work.weixin.qq.com/api/doc#10112 https://qyapi.weixin.qq.com/cgi-b ...

  6. 在ubuntu中如何向U盘复制粘贴文件 Read-only file system

    1.  重新挂载被操作分区的读写权限,如U盘 $ sudo mount -o remount,rw /media/lenmom/00093FA700017B96 #U盘挂载目录,如果是系统中的其他盘, ...

  7. c++并发编程实战 笔记

    http://blog.csdn.net/u010087886/article/category/5884745

  8. php 编程笔记分享

    php获取POST数据的三种方法php 图片加水印源代码php+ajax+json的一个最简单实例php 汉字转拼音源码php遍历目录,生成目录下每个文件的md5值并写入到结果文件中php实现linu ...

  9. X-Requested-With

    最近工作中发现,使用angular $http跨域的时候,虽然后台已经配置了跨域允许,但是还是报错. 查资料发现,angular $http 的request的请求头中,默认有: Access-Con ...

  10. PS制作gif动图教程

    之前做过一些动图,时间久了就忘记了,每次心血来潮想做的时候又要重新找资料,网上的教程都不够完整,因此整理了一份完整的教程,针对PS新手(对,没错,就是博主自己哈哈). 准备工作:photoshop.图 ...