RDP 数据库简介
在扩增子数据分析中,有时会发现多个OTU 注释到了同一个species , 为什么会出现这种情况呢?
首先既然在OTU水平能分开,说明序列的相似度小于97%, 同一个物种的同一个基因的片段相似度会小于97%吗?
答案是肯定的;
对细菌,古菌,真菌来说,在species 水平下面,还有1个strain 水平,而同一个species的不同strain, 有可能会相似度小于97%;
以RDP 下载的 Fungi 数据来说,在原始数据中,会有很多类似下面这种的序列
>S000448483 Sparassis crispa; MBUH-PIRJO&ILKKA94-1587/ss5
>S000448484 Sparassis crispa; MBUH-ILKKA88-2036/ss6
>S000415306 Sparassis crispa; MAFF 238626
>S000448480 Sparassis crispa; YCD2470/ss2
>S000448481 Sparassis crispa; YCD2637/ss3
>S000448482 Sparassis crispa; MBUH-SAVOLAINEN/ss4
>S000448487 Sparassis crispa; zw-clarku003/ss9
>S000448488 Sparassis crispa; BMS2857/ss10
>S000448479 Sparassis crispa; YCD2145/ss1
>S000448492 Sparassis crispa; HKAS15728/ss19
>S000448493 Sparassis crispa; HKAS32363/ss20
>S000448491 Sparassis crispa; HMAS60590/ss17
>S000448496 Sparassis crispa; RB9/6/87/ss23
>S000448494 Sparassis crispa; HKAS17477/ss21
>S000448498 Sparassis crispa; MBUH-DORISLABER/ss25
>S000448506 Sparassis crispa; FFPRI-TSENGOKU/ss34
>S003841092 Sparassis crispa; JB10
>S000448501 Sparassis crispa; TENN44575/ss28
>S003827683 Sparassis crispa; HKAS43721; AFTOL-ID 703
>S003856778 Sparassis crispa
我截取了部分,前面的 "Sparassis crispa" 是1个物种,而;后面类似 "MBUH-PIRJO&ILKKA94-1587/ss5" 则是不同的strain,
"MBUH-PIRJO&ILKKA94-1587/ss5" 在NCBI 的Nuclteotide 数据库的链接如下
https://www.ncbi.nlm.nih.gov/nuccore/AY218534.1

通过上图,一目了然,species 和 strain 的关系,1个物种有很多的strain , 而在这些strain 之间,就会存在相似度小于 97% 的strain。
RDP 数据库简介的更多相关文章
- MongoDB数据库简介及安装
一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...
- Oracle数据库简介
Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...
- 数据库 简介 升级 SQLite 总结 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- MongoDB,无模式文档型数据库简介
MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...
- 全球第一开源ERP Odoo操作手册 数据库简介
1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...
- rrnDB数据库简介-16S基因多拷贝数的证据
16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene.利用功能基因作为ma ...
- MySql数据库基础之数据库简介及安装
MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...
- Scopus数据库简介
ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...
- 数据库----ORACLE和MYSQL数据库简介
一.什么是数据库? 数据库(Database---DB)按照组织.储存和管理数据的仓库.(理解以下三个概念) 数据(Data)用来描述事物的记录都可称数据,如文字音乐图像. 数据库系统(Dat ...
随机推荐
- BZOJ.4298.[ONTAK2015]Bajtocja(Hash 启发式合并)
题目链接 \(Description\) 给定\(d\)张无向图,每张图都有\(n\)个点.一开始,在任何一张图中都没有任何边. 接下来有\(m\)次操作,每次操作会给出\(a,b,k\),意为在第\ ...
- memcached 一致性哈希算法
本文转载自:http://blog.csdn.net/kongqz/article/details/6695417 一.概述 1.我们的memcache客户端使用了一致性hash算法ketama进行数 ...
- git 删除分支 远程 && 本地
//查看远程分支 git branch -a //删除远程分支 git branch -r -d origin/branch-name git push origin :branch-name// 或 ...
- centos 7 安装 php 5.5 5.6 7.0
查看当前安装的PHP包 [root@node1 ~]# yum list installed | grep php php56w.x86_64 -.w7 @webtatic php56w-cli.x8 ...
- Linux 操作 oracle 数据库
1.Oracle监听启动命令:lsnrctl start 2. sqlplus 登录数据库 3.OS版本及Oracle版本 select banner from v$version; 4.查询该数 ...
- 浅谈压缩感知(二十):OMP与压缩感知
主要内容: OMP在稀疏分解与压缩感知中的异同 压缩感知通过OMP重构信号的唯一性 一.OMP在稀疏分解与压缩感知中的异同 .稀疏分解要解决的问题是在冗余字典(超完备字典)A中选出k列,用这k列的线性 ...
- 手机 https 抓包---Charles篇
原文出处: Lu尼玛的想疗院 作为一名现代前端,除了要掌握html,css,js 以及一系列乱七八糟框架之外,还得懂得如何抓包改包.当然,常规的网站或者自主开发的我们往往使用 chrome或者 fir ...
- KVM虚拟化管理 virt manager常用操作
部分涉及到Linux.Nginx.tomcat.MySQL等的点滴操作记录,时间长了,就忘掉了,偶尔整理一下操作的history,就此简要备份一下: [原][BG]-一次虚拟化环境实践简要记录: ht ...
- Mongodb查询命令详解
前面我们简单的讲了下find方法,下面来深入的过一下它的用法以及常用的字方法. 下面是mongo中db.user.help()中对find方法的定义和解释: db.user.find([query], ...
- 深入理解JS执行细节(写的很精辟)
来源于:http://www.cnblogs.com/onepixel/p/5090799.html javascript从定义到执行,JS引擎在实现层做了很多初始化工作,因此在学习JS引擎工作机制之 ...