CDS & ORF & 启动子 & 终止子 & 转录因子 & 基因结构 & UTR
ORF和CDS的区别
ORF的英文展开是open reading frame(开放阅读框)。
CDS的英文展开是coding sequences (编码区)。
CDS:DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一 一对应的DNA序列,且该序列中间不含其它非该蛋白质对应的序列,不考虑mRNA加工等过程中的序列变化,总之,就是与蛋白质的密码子完全对应.
ORF:理论上的氨基酸编码区,一般是在分析DNA核酸图谱中(主要是利用电脑程序)得到的。程序会自动在DNA序列中寻找启动因子(ATG或AUG),然后按每3个核酸一组,一直延伸寻找下去,直到碰到终止因子(TAA或TAG)。程序把这个区域当成ORF区,认为理论上可以编码一组氨基酸。
但问题是,在一个整体核酸序列中寻找ATG并不靠谱。因为寻找到的ATG很可能是两个氨基酸编码片段的尾和头的混合体。比如AACGCATGCAGC.
看上面这个小序列,如果以T为中心,会有三种编码组合的可能。即
(1)ATG(T在中心)电脑程序发现的启动因子的组合
(2)CAT(T在最右侧)
(3)TGC(T在最左侧)本例中实际核酸编码的组合。
这就是ORF三种框架的来源。实际上,DNA序列可以按六种框架阅读和翻译(每条链三种,对应六种不同的三联密码子)。
所以,我们说ORF只是理论上的编码区,与真实的情景可能并不一样。
而CDS是检查cDNA后得到的编码组合序列,和实际情景比较接近。
启动子与起始密码子、终止子与终止密码子有何区别?
启动子与起始密码子、终止子与终止密码子看起来似乎差不多,实际上却是两组截然不同的概念,根本就没有共同点。
简单地说,启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录。而起始密码子和终止密码子都是mRNA上的三联体碱基序列,分别决定翻译的起始和终止。
启动子——DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域,在许多情况下,还包括促进这一过程的调节蛋白的结合位点。
强启动子(strong promoter),指对RNA聚合酶有很高亲和力的启动子,它能指导合成大量的mRNA。
起始密码子——蛋白质翻译过程中被核糖体识别并与起始tRNA(原核生物为甲酰甲硫氨酸tRNA,真核生物是甲硫氨酸tRNA)结合而作为肽链起始合成的信使核糖核酸(mRNA)三联体碱基序列。大部分情况下为AUG,原核生物中有时为GUG等。
终止子——转录过程中能够终止RNA聚合酶转录的DNA序列。使RNA合成终止。
终止密码子——蛋白质翻译过程中终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列。一般情况下为UAA、UAG和UGA,它们不编码氨基酸。
转录因子:转录因子(transcription factor)是一群能与基因5`端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。
转录因子的结合位点(transcription factor binding site,TFBS)是转录因子调节基因表达时,与基因模板链结合的区域。按照常识,转录因子(transcription factor,TF)的结合位点一般应该分布在基因的前端,但是,新的研究发现,人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端。
UTR(Untranslated Regions)即非翻译区,是信使RNA(mRNA)分子两端的非编码片段。
5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3'-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端。
参考:
CDS & ORF & 启动子 & 终止子 & 转录因子 & 基因结构 & UTR的更多相关文章
- 真核生物基因结构 & mRNA结构
参考: 分子生物学教材 再一次,翻看真核生物基因结构! mRNA基本结构特点 Structure and function of Messenger RNA (mRNA ) 基因结构 其实这个结构不完 ...
- 【基因组预测】braker2基因结构注释要点记录
目录 流程使用 问题 记录下braker2的使用要点,以备忘记. 流程使用 braker2有很多流程,根据你的数据:组装的基因组.转录组.蛋白(同源,包括近缘或远缘)选择不同流程,官网有说明: htt ...
- 基于PASA进行基因预测
PASA, acronym for Program to Assemble Spliced Alignments, is a eukaryotic genome annotation tool tha ...
- 【GS文献】基因组选择技术在农业动物育种中的应用
中国农业大学等多家单位2017年合作发表在<遗传>杂志上的综述,笔记之. 作者中还有李宁院士,不胜唏嘘. 1.概述 GS的两大难题:基因组分型的成本,基因组育种值(genomic esti ...
- 项目二:使用机器学习(SVM)进行基因预测
SVM软件包 LIBSVM -- A Library for Support Vector Machines(本项目所用到的SVM包)(目前最新版:libsvm-3.21,2016年7月8日) C-S ...
- CDS视图篇 2
核心数据服务 (CDS) 公司希望使用 SAPS/4HANA 核心数据服务 (CDS) 视图技术.需要学习 CDS 视 图的概念和结构以及语法 . ● 核心数据服务是用于业务实体的 SAP 战略建模方 ...
- WGCNA构建基因共表达网络详细教程
这篇文章更多的是对于混乱的中文资源的梳理,并补充了一些没有提到的重要参数,希望大家不会踩坑. 1. 简介 1.1 背景 WGCNA(weighted gene co-expression networ ...
- Augustus 进行基因注释
目前的从头预测软件大多是基于HMM(隐马尔科夫链)和贝叶斯理论,通过已有物种的注释信息对软件进行训练,从训练结果中去推断一段基因序列中可能的结构,在这方面做的最好的工具是AUGUSTUS它可以仅使 ...
- MIT Molecular Biology 笔记6 转录的调控
视频 https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...
随机推荐
- yii2--windows下composer安装
//文件及存放目录 D:\php\php.exe D:\php\composer.phar //设置path(追加) ; D:\php //创建composer.bat文件 D:\php>ech ...
- MSF渗透测试-CVE-2017-11882(MSOffice漏洞)
1.测试环境 2.测试前准备 3.测试过程 -3.1虚拟机环境测试 -3.2局域网靶机测试 4.测试感想 1.测试环境 攻击机: OS:kail IP:192.168.15.132/192.168.1 ...
- 谷歌浏览器使用IE内核
经常使用谷歌浏览器去到处溜达,可是,居然还不知道谷歌浏览的还有很多新鲜的设置,昨天遇到了调试一个脚本没有出现效果,而在IE中就可以显示所谓的效果: 查询了下,看到谷歌浏览器确实对脚本的部分样式要求还是 ...
- 把kafka数据从hbase迁移到hdfs,并按天加载到hive表(hbase与hadoop为不同集群)
需求:由于我们用的阿里云Hbase,按存储收费,现在需要把kafka的数据直接同步到自己搭建的hadoop集群上,(kafka和hadoop集群在同一个局域网),然后对接到hive表中去,表按每天做分 ...
- 自己封装的ajax
/** * ITCAST WEB * Created by lsy on 2016/5/24. */ /* * 1. 请求的类型 type get post * 2. 请求地址 url * 3. 是异 ...
- STM32硬件IIC
/** * @brief 写一个字节到I2C设备中 * @param * @arg pBuffer:缓冲区指针 * @arg WriteAddr:写地址 * @retval 正常返回1,异常返回0 * ...
- CmsEasy 5.5 cut_image 代码执行漏洞
3 CmsEasy 5.5 cut_image 代码执行漏洞 3.1 摘要 3.1.1 漏洞介绍 CmsEasy是一款基于PHP+MySQL架构的网站内容管理系统,可面向大中型站点提供重量级网站建设解 ...
- hosts 位置和功能
什么是HOST文件: Hosts是一个没有扩展名的系统文件,其基本作用就是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hos ...
- http://www.360doc.com/content/18/0406/16/15102180_743316618.shtml
http://www.360doc.com/content/18/0406/16/15102180_743316618.shtml
- UVA 3942 Remember the Word (Trie+DP)题解
思路: 大白里Trie的例题,开篇就是一句很容易推出....orz 这里需要Trie+DP解决. 仔细想想我们可以得到dp[i]=sum(dp[i+len[x]]). 这里需要解释一下:dp是从最后一 ...