16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene。利用功能基因作为mark  gene, 相比16S有什么优势呢?

在功能基因的文献中指出了两点:

1) 不同物种的16S基因序列可能完全相同,尤其是在二代测序中,我们通常指扩增16S的部分序列,这样不同物种扩增出来的序列完全相同的概率大大增加,这样不同有效的区分物种,所以说利用16S基因做的species 水平的注释,可信度一般;

2)16S基因在一个物种中会有多拷贝,这样PCR是会有多个扩增产物,这样导致在OTU 定量会引入错误,比如物种A只有1个16S基因,物种B有2个16S基因,在群落中,二者丰度相同,经过相同循环次数的PCR , 理论上最终测序得到的reads中,物种B的reads会是物种A的2倍; 在16S研究中,我们通常使用reads 表征某个OTU的分度,尽管在群落中物种A和B相同,但是由于拷贝数的差异,所以定量的结果,不能正确的反映在群落中二者的丰度比例;丰度定量不准确,对于后续的alpha 和 beta 多样性的分析都会有影响;

之前只是文章中这么一说,对于某个物种16S的拷贝数也没有认真去研究过,今天看到了rrnDB 这个数据库;

这个数据库中收录了16S基因为多拷贝的物种;可以直观的看到16S基因多拷贝的现象;

数据库网址如下:

https://rrndb.umms.med.umich.edu/

点击导航栏的 search 按钮,先看一下数据库中的具体记录

先用默认的关键字进行检索,看下检索出来的记录,点击下图的Search 按钮,

检索的结果如下:

第一列Data source record id 是物种基因组在NCBI中的版本号,Data source organism name 是物种名称,RDP  taxa 是在RDP 数据库中的注释信息,最后一列16S copies 就是在该物种中16S基因的拷贝数;

从检索的结果可以直观的看出,还是有很多的物种存在16S基因多拷贝的现象;

最新更新的RDP Classifier 程序中,考虑了16S基因的多拷贝现象,对于16S基因的多拷贝数问题,通过这个数据库可以更加直观的了解。

rrnDB数据库简介-16S基因多拷贝数的证据的更多相关文章

  1. MongoDB数据库简介及安装

    一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...

  2. Oracle数据库简介

    Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...

  3. 数据库 简介 升级 SQLite 总结 MD

    Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

  4. MongoDB,无模式文档型数据库简介

    MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...

  5. 全球第一开源ERP Odoo操作手册 数据库简介

    1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...

  6. PHI 数据库简介

    PHI是一个致病菌的数据库,截止到2017年8月1号为止,最新的版本是4.3,数据库中收录了实验验证过的致病菌的信息,其中有176个来自动物的致病菌,227个来自植物的致病菌,3个来自真菌的致病菌; ...

  7. KEGG orthology (KO) 数据库简介

    KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库: KEGG Orthology 简称KO, 对于每个功能已知的基 ...

  8. MySql数据库基础之数据库简介及安装

    MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...

  9. Scopus数据库简介

    ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...

随机推荐

  1. Asp.Net微信支付接口之jsApiPay教程

      1.微信支付JsApiPay只能在微信浏览器中使用 2.必须先申请微信支付功能 3.设置域名 4.设置支付授权目录 一定要精确到最后一级目录 5.获取APPID和AppSecret AppSecr ...

  2. Docker 构建网络服务后本机不能访问

    Docker 构建网络服务后本机不能访问 起因 使用tornado构建了一个服务,测试都没有问题 使用docker构建镜像,使用docker run image_name启动服务 使用浏览器访问 12 ...

  3. spring 事务传播行为实例分析

    Spring事务传播行为: spring特有的事务传播行为,spring支持7种事务传播行为,确定客户端和被调用端的事务边界(说得通俗一点就是多个具有事务控制的service的相互调用时所形成的复杂的 ...

  4. 使用MSYS、Notepad++搭建C/C++开发环境

    目标说明 本文的目标是教会大家如何用Notepad++来编写C/C++代码,并能够编译运行. 注:Notepad++是一个非常优秀的开源文本编辑器.官网地址 http://notepad-plus-p ...

  5. IP段对应表

    IP段对应表   IP总数 子网掩码 C段个数 /30 4 255.255.255.252 1/64 /29 8 255.255.255.248 1/32 /28 16 255.255.255.240 ...

  6. (转载)设计模式之-策略模式(Strategy)

    原文:http://blog.sina.com.cn/s/blog_48df74430100t2m7.html 前言 部门组织培训,<Effective Java>,每人每天给大家讲解一节 ...

  7. 1. K-Means原理解析

    1. K-Means原理解析 2. K-Means的优化 3. sklearn的K-Means的使用 4. K-Means和K-Means++实现 1. 前言 我们在一开始的时候应该就说过,机器学习按 ...

  8. Faiss教程:索引(1)

    索引是faiss的关键知识,我们重点介绍下. 索引方法汇总 有些索引名,我就不翻译了,根据英文名去学习更准确. 索引名 类名 index_factory 主要参数 字节数/向量 精准检索 备注 精准的 ...

  9. tongjiword,write / read file demo

    1.tong ji letter demo mport sys def tongjiword(): fi =open(paht,'r') cont=fi.read() wl={} for line i ...

  10. Android VLC播放器二次开发2——CPU类型检查+界面初始化

    上一篇讲了VLC整个程序的模块划分和界面主要使用的技术,今天分析一下VLC程序初始化过程,主要是初始化界面.加载解码库的操作.今天主要分析一下org.videolan.vlc.gui.MainActi ...