16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene。利用功能基因作为mark  gene, 相比16S有什么优势呢?

在功能基因的文献中指出了两点:

1) 不同物种的16S基因序列可能完全相同,尤其是在二代测序中,我们通常指扩增16S的部分序列,这样不同物种扩增出来的序列完全相同的概率大大增加,这样不同有效的区分物种,所以说利用16S基因做的species 水平的注释,可信度一般;

2)16S基因在一个物种中会有多拷贝,这样PCR是会有多个扩增产物,这样导致在OTU 定量会引入错误,比如物种A只有1个16S基因,物种B有2个16S基因,在群落中,二者丰度相同,经过相同循环次数的PCR , 理论上最终测序得到的reads中,物种B的reads会是物种A的2倍; 在16S研究中,我们通常使用reads 表征某个OTU的分度,尽管在群落中物种A和B相同,但是由于拷贝数的差异,所以定量的结果,不能正确的反映在群落中二者的丰度比例;丰度定量不准确,对于后续的alpha 和 beta 多样性的分析都会有影响;

之前只是文章中这么一说,对于某个物种16S的拷贝数也没有认真去研究过,今天看到了rrnDB 这个数据库;

这个数据库中收录了16S基因为多拷贝的物种;可以直观的看到16S基因多拷贝的现象;

数据库网址如下:

https://rrndb.umms.med.umich.edu/

点击导航栏的 search 按钮,先看一下数据库中的具体记录

先用默认的关键字进行检索,看下检索出来的记录,点击下图的Search 按钮,

检索的结果如下:

第一列Data source record id 是物种基因组在NCBI中的版本号,Data source organism name 是物种名称,RDP  taxa 是在RDP 数据库中的注释信息,最后一列16S copies 就是在该物种中16S基因的拷贝数;

从检索的结果可以直观的看出,还是有很多的物种存在16S基因多拷贝的现象;

最新更新的RDP Classifier 程序中,考虑了16S基因的多拷贝现象,对于16S基因的多拷贝数问题,通过这个数据库可以更加直观的了解。

rrnDB数据库简介-16S基因多拷贝数的证据的更多相关文章

  1. MongoDB数据库简介及安装

    一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...

  2. Oracle数据库简介

    Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...

  3. 数据库 简介 升级 SQLite 总结 MD

    Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

  4. MongoDB,无模式文档型数据库简介

    MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...

  5. 全球第一开源ERP Odoo操作手册 数据库简介

    1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...

  6. PHI 数据库简介

    PHI是一个致病菌的数据库,截止到2017年8月1号为止,最新的版本是4.3,数据库中收录了实验验证过的致病菌的信息,其中有176个来自动物的致病菌,227个来自植物的致病菌,3个来自真菌的致病菌; ...

  7. KEGG orthology (KO) 数据库简介

    KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库: KEGG Orthology 简称KO, 对于每个功能已知的基 ...

  8. MySql数据库基础之数据库简介及安装

    MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...

  9. Scopus数据库简介

    ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...

随机推荐

  1. Python写入连接mysql失败

    执行如下连接数据库的语句: engine = create_engine('mysql://root:root@127.0.0.1/stock?charset=utf8') 报错如下: ImportE ...

  2. 【神经网络】LSTM 网络

      Long Short Term 网络—— 一般就叫做 LSTM ——是一种 RNN 特殊的类型,可以学习长期依赖信息.LSTM 由Hochreiter & Schmidhuber (199 ...

  3. 【机器学习】Softmax 和Logistic Regression回归Sigmod

    二分类问题Sigmod 在 logistic 回归中,我们的训练集由  个已标记的样本构成: ,其中输入特征.(我们对符号的约定如下:特征向量  的维度为 ,其中  对应截距项 .) 由于 logis ...

  4. asp.net mvc之TempData、ViewData、ViewBag

    ★ViewData和ViewBag:生命周期相同,仅对当前View有效,不同的是ViewBag的类型不是字典的键值对结构,而是dynamic动态类型. ViewData ViewBag Key/Val ...

  5. C# using关键字 --转

    其实对于.NET的学习者一开始都接触using这个关键字了,可能大家没有怎么在意,包括我本人也是的,直到今天有人问我using的作用时,才引起了我的注意.       概况来说可以分为两种:第一种,就 ...

  6. mac上使用zsh配置环境变量

    Mac配置环境变量的地方 一./etc/profile (建议不修改这个文件 ) 全局(公有)配置,不管是哪个用户,登录时都会读取该文件. 二./etc/bashrc (一般在这个文件中添加系统级环境 ...

  7. C语言 · 删除重复元素

    算法提高 11-2删除重复元素   时间限制:10.0s   内存限制:256.0MB      问题描述 为库设计新函数DelPack,删除输入字符串中所有的重复元素.不连续的重复元素也要删除. 要 ...

  8. Android——SQLite数据库(二)升级数据库、增、删、改、查、事务

    xml <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android= ...

  9. boot cd_rom struct

    资料: 1.introduction_to_iso9660.pdf 2.boot-cdrom.pdf Normal ISO9600:offset: 16*2048[0x8000] The Primar ...

  10. sqoop 常用命令整理(二)

    26.Validate 它用来比较源数据和目标数据的数量 它有三个接口 Validator. 它有三个接口 Validator. Property: validator Description: Dr ...