16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene。利用功能基因作为mark  gene, 相比16S有什么优势呢?

在功能基因的文献中指出了两点:

1) 不同物种的16S基因序列可能完全相同,尤其是在二代测序中,我们通常指扩增16S的部分序列,这样不同物种扩增出来的序列完全相同的概率大大增加,这样不同有效的区分物种,所以说利用16S基因做的species 水平的注释,可信度一般;

2)16S基因在一个物种中会有多拷贝,这样PCR是会有多个扩增产物,这样导致在OTU 定量会引入错误,比如物种A只有1个16S基因,物种B有2个16S基因,在群落中,二者丰度相同,经过相同循环次数的PCR , 理论上最终测序得到的reads中,物种B的reads会是物种A的2倍; 在16S研究中,我们通常使用reads 表征某个OTU的分度,尽管在群落中物种A和B相同,但是由于拷贝数的差异,所以定量的结果,不能正确的反映在群落中二者的丰度比例;丰度定量不准确,对于后续的alpha 和 beta 多样性的分析都会有影响;

之前只是文章中这么一说,对于某个物种16S的拷贝数也没有认真去研究过,今天看到了rrnDB 这个数据库;

这个数据库中收录了16S基因为多拷贝的物种;可以直观的看到16S基因多拷贝的现象;

数据库网址如下:

https://rrndb.umms.med.umich.edu/

点击导航栏的 search 按钮,先看一下数据库中的具体记录

先用默认的关键字进行检索,看下检索出来的记录,点击下图的Search 按钮,

检索的结果如下:

第一列Data source record id 是物种基因组在NCBI中的版本号,Data source organism name 是物种名称,RDP  taxa 是在RDP 数据库中的注释信息,最后一列16S copies 就是在该物种中16S基因的拷贝数;

从检索的结果可以直观的看出,还是有很多的物种存在16S基因多拷贝的现象;

最新更新的RDP Classifier 程序中,考虑了16S基因的多拷贝现象,对于16S基因的多拷贝数问题,通过这个数据库可以更加直观的了解。

rrnDB数据库简介-16S基因多拷贝数的证据的更多相关文章

  1. MongoDB数据库简介及安装

    一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...

  2. Oracle数据库简介

    Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...

  3. 数据库 简介 升级 SQLite 总结 MD

    Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

  4. MongoDB,无模式文档型数据库简介

    MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...

  5. 全球第一开源ERP Odoo操作手册 数据库简介

    1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...

  6. PHI 数据库简介

    PHI是一个致病菌的数据库,截止到2017年8月1号为止,最新的版本是4.3,数据库中收录了实验验证过的致病菌的信息,其中有176个来自动物的致病菌,227个来自植物的致病菌,3个来自真菌的致病菌; ...

  7. KEGG orthology (KO) 数据库简介

    KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库: KEGG Orthology 简称KO, 对于每个功能已知的基 ...

  8. MySql数据库基础之数据库简介及安装

    MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...

  9. Scopus数据库简介

    ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...

随机推荐

  1. Kafka 协议实现中的内存优化【转】

    Kafka 协议实现中的内存优化   Jusfr 原创,转载请注明来自博客园 Request 与 Response 的响应格式 Request 与 Response 都是以 长度+内容 形式描述, 见 ...

  2. 【C/C++】struct探索·extern "C"含义探索 ·C++与C的混合编程·C 语言高效编程的几招

    本文为笔者阅读<嵌入式C精华>的摘录,推荐一下,不错的书 一.C/C++语言 struct深层探索 1.自然对界 struct是一种复合数据类型,其构成元素既可以是基本数据类型(如 int ...

  3. nginx源码分析:打开监听套接字的流程

    问题源于在分析nginx的源码时,找了半天没有找到nginx是怎么把监听套接字读事件添加到事件循环中的,后经过仔细的分析,终于搞明白,于是记录一下. 在上一篇module机制中介绍了nginx添加mo ...

  4. 使用一层神经网络训练mnist数据集

    import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_dat ...

  5. Silverlight跨域访问wcf

    添加文件名为“clientaccesspolicy.xml”的文件 内容: <?xml version="1.0" encoding="utf-8"?&g ...

  6. Java springboot项目的jar发布方式

    做springboot的都知道,发布方式不是war发布了,是jar发布,启动jar就可以直接运行,并且环境都是集成的. 首先,先将项目打包成jar,这里假设你的eclipse已经安装了maven插件. ...

  7. Android RecyclerView网格布局

    一个简单的网格布局activity_main.xml <?xml version="1.0" encoding="utf-8"?> <andr ...

  8. nginx servername配置域名网站可以正常登录,servername配置IP+Port却无法正常登录

    由于业务的原因,需要将网站从通过域名访问变换为通过IP+PORT的访问方式: 以前的配置: server { listen ; server_name wx.xxxx.com; } 以前的登录页面: ...

  9. Linux 获取 MAC 地址并去除 : 字符

    ifconfig -a | grep eth0 | awk -F ' ' '{print $5}' | sed 's/://g'

  10. mysql查找有某列但没有此列索引的表

    select a.TABLE_SCHEMA,a.TABLE_NAME from information_schema.`COLUMNS` a left join (select 'etl_stamp' ...