CIRI 识别circRNA的原理
CIRI 根据circRNA 连接点处的reads来识别circRNA, 在连接点处的reads 其比对情况非常特殊;
CIRI 根据3种模型来识别circRNA, 连接点处的read 叫做junction read
A)

circRNA 由3个外显子环化形成, 由于测序读长的限制,junction read 只覆盖了起始外显子和终止外显子的部分序列,这两部分reads的比对位置在基因组上的位置是相反的,
B)

circRNA 由3个外显子环化形成, 由于连接点处的一个外显子其长度太短,junction read 除了覆盖了起始外显子和终止外显子的两部分序列外,还覆盖了中间的一个外显子的部分序列
C)

circRNA 由1个外显子环化形成, junction read 除了覆盖了整个外显子外,还重复又读了一部分序列
D)

为了进一步降低假阳性率,CIRI 通过以下3条规则对结果进行过滤:
1)双端测序的两条reads 必须符合PEM 信号,以上面的示意图为例,进行说明
read1 是一条junction read, 来源于两个外显子,根据read1 的比对情况,确定了circRNA 在基因组上的位置,此时,如果这个circRNA 识别准确,那么read2 就肯定落在对应的位置内;
根据两条reads的比对情况,进一步过滤结果;
2) 检测到的circRNA 的连接处符合AG-GT 剪切信号;
3)根据比对的质量和数量进行过滤,质量就是说mapping 的质量越高,识别的circRNA 越准确;数量就是说对于某个circRNA来说,检测到的juntion reads 越多,说明这个circRNA越可靠;
上面图中的几种模型只是帮助我们理解了exonic-circRNA的检测,其实对于non-exonic circRNA(包括intronic circRNA 和 intergenic circRNA)的检测,其原理是相似的,只是综合考虑了测序读长和连接点两段序列的长度,提出几种可能的比对模型,然后根据比对模型来检测对应的junction reads, 从而预测circRNA;
circRNA 结果的验证:
以一个预测得到的circRNA chr2: 58,311,224|58,316,858 为例,在基因组上的长度为 5634bp, 其连接点为VRK2基因的exon6和exon10

理论上产生的circRNA的序列为所有外显子组成的序列,splicing length为407bp

为了验证该circRNA , 根据连接点两端的序列设计引物,扩增出该circRNA 片段,跑电泳,确定产物长度

图中的黑色片段为扩增产物的条带,根据PAGE 电泳的结果,确定其长度;然后进行一代测序,确定具体序列

参考文献:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-014-0571-3
CIRI 识别circRNA的原理的更多相关文章
- find_circ 识别circRNA 的原理
find_circ 通过识别junction reads 来预测circRNA 和参考基因组比对完之后,首先剔除和基因组完全比对的reads,保留没比对上的reads, 这部分reads 直接比是比对 ...
- Atitit 图像清晰度 模糊度 检测 识别 评价算法 原理
Atitit 图像清晰度 模糊度 检测 识别 评价算法 原理 1.1. 图像边缘一般都是通过对图像进行梯度运算来实现的1 1.2. Remark: 1 1.3. 1.失焦检测. 衡量画面模糊的主要方 ...
- [免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用
目 录 1..... 应用概述... 2 2..... 免费下载试用... 2 3..... 视频介绍... 2 4..... iNeuLink.Ocr图像数据采集应用... 2 5... ...
- Atitit ocr识别原理 与概论 attilax总结
Atitit ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
- 浅谈意图识别各种实现&数学原理
\[ J_\alpha(x) = \sum_{m=0}^\infty \frac{(-1)^m}{m! \Gamma (m + \alpha + 1)} {\left({ \frac{x}{2} }\ ...
- QTP - 工作原理
1.QTP的工作原理测试对象是QTP在测试或组件中创建的用于表示应用程序中的实际对象的对象,并且QuickTest在对象库中存储有关该对象的信息,包括对象的属性.操作等.录制的时候,QTP将操作过的所 ...
- circRNA
一.circRNA序列提取 环状RNA (circRNA)是一类不具有 5' 末端帽子和 3' 末端 poly(A)尾巴.并以共价键形成环形结构的非编码 RNA 分子. 环状RNA (circRNA) ...
- 颜色传感器TCS230及颜色识别电路(转)
摘要 TCS230是美国TAOS公司生产的一种可编程彩色光到频率的传感器.该传感器具有分辨率高.可编程的颜色选择与输出定标.单电源供电等特点:输出为数字量,可直接与微处理器连接.文中主要介绍TCS23 ...
- Python的开源人脸识别库:离线识别率高达99.38%
Python的开源人脸识别库:离线识别率高达99.38% github源码:https://github.com/ageitgey/face_recognition#face-recognitio ...
随机推荐
- angular.js 中的作用域 数据模型 控制器
1.angular.js 作为后起之秀的前端mvc框架,他于传统的前端框架都不同,我们再也不需要在html中嵌入脚本来操作对象了.它抽象出了数据模型,控制器及视图. 成功解耦了应用逻辑,数据模型,视图 ...
- CSS的引用方式(引用外部样式表、内部样式表、内联样式表)
CSS引用外部样式表的优点:一般的浏览器都带有缓存功能,所以用户不用每次都下载此CSS文件,所以外部引用相对于内部引用和内联引用来说是是节省资源的. CSS使用内部样式表.内联样式表的优点:可以直观的 ...
- 如何用adb抓取log?
在Androidclient的測试过程中,有时候我们会遇到闪退等异常情况. 这时我们能够通过adb抓取log.从而给开发提供很多其它信息. 一.下载ADB.exe 在网上搜索"adb ...
- webBench&ad网站并发测试工具
webBench 测试工具使用,网站上线前压力测试工具. ad测试工具
- 基于Nginx实现10万+并发,你应该做的Linux内核优化
由于默认的linux内核参数考虑的是最通用场景,这明显不符合用于支持高并发访问的Web服务器的定义,所以需要修改Linux内核参数,是的Nginx可以拥有更高的性能: 在优化内核时,可以做的事情很多, ...
- Memory Analyzer tool(MAT)分析内存泄漏---理解Retained Heap、Shallow Heap、GC Root
Shallow Heap Size 指对象自身所占用的内存大小,不包含其引用的对象所占的内存大小. 1.数组类型 数组元素对象所占内存的大小总和. 2.非数组类型 对象与它所有的成员变量大小的总和.当 ...
- VS2012插件推荐
其实Metro的感觉有了,但是这两种配色都不太喜欢..白色太扎眼,黑色太瞎眼……有木有灰色的啊喂(有没有其他主题?看后面↓) 黑色主题绝对是熬夜码农必备……但是十分不适合在白天使用. 下面来分享几个好 ...
- python(31) enumerate 的用法
例子一: b = "abcd" kv_dict = {} pre = 1234 for i, v in enumerate(b): kv_dict['%s-%d.jpg' %(pr ...
- python基础系列教程——Python的安装与测试:python的IDE工具PyDev和pycharm,anaconda
---恢复内容开始--- python基础系列教程——Python的安装与测试:python的IDE工具PyDev和pycharm,anaconda 从头开启python的开发环境搭建.安装比较简单, ...
- wp中的动画
动画目标:必须是依赖属性.可以用于Double,Color,Point,Object类型.对应的动画类后面加Animation,下面代码演示旋转360°. <Button Content=&qu ...