RNA-Seq基因组比对工具HISAT2】的更多相关文章

原文网址: http://blog.biochen.com/archives/337 HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2.官网:https://ccb.jhu.edu/software/hisat2/index.shtml HISAT2安装 下载HISAT2-2.0.1,并解压: unzip hisat2-2.0.1-beta-Linux_x86_64…
两种RNA seq的基因表达量计算方法: 1. RPKM:http://www.plob.org/2011/10/24/294.html 2. RSEM:这个是TCGAdata中使用的.RSEM据说比RPKM更有优势.anyway,原来还以为TCGA 的data需要重新换算成RPKM,现在不需要了~:)…
RNA -seq RNA-seq目的.用处::可以帮助我们了解,各种比较条件下,所有基因的表达情况的差异. 比如:正常组织和肿瘤组织的之间的差异:检测药物治疗前后,基因表达的差异:检测发育过程中,不同的发育阶段,不同的组织之间的基因表达差异 等 在所有检测的差异类型中,最常用的一种检测就是:检测所有mRNA的表达量的差异. 还可以检测 RNA 的结构上的差异.例如:mRNA的剪接方式的差异,即“可变剪接”:还可以检测“融合基因”,同时还可以检测基因单点突变导致的SNP. 测序方法.步骤:人的细胞…
软件简介 MCScanX工具集对MCScan算法进行了调整,用于检测共线性和同线性区域,还增加了可视化和下游分析..MCscanX有三个核心工具,以及12个下游分析工具. 软件安装 进入官网http://chibba.pgml.uga.edu/mcscan2/#tm,下载安装 1 unzip MCscanX.zip 2 cd MCScanX 3 make 软件使用 所需要文件 两个或多个物种的gff文件,蛋白序列(** 该软件最多能做5个物种的共线性) 第一步:构建索引,进行blastp比对 注…
文献:Sahraeian S M E, Mohiyuddin M, Sebra R, et al. Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis[J]. Nature Communications, 2017, 8(1):59. 这是一篇在NC上发表的使用RNAseq工具对比的一篇文献,解读这篇文献对我们使用RNAseq…
RNA测序相对基因表达芯片有什么优势? RNA-Seq和基因表达芯片相比,哪种方法更有优势?关键看适用不适用.那么RNA-Seq适用哪些研究方向?是否您的研究?来跟随本文了解一下RNA测序相对基因表达芯片有什么优势? 无假设的研究设计和更高的发现能力RNA-Seq是一种基于测序的强大方法,让研究人员能够打破传统技术的低效和花费,如实时定量PCR(RT-PCR)和芯片.无论是将RNA-Seq添加到现有的研究方法中,还是从一种方法彻底转换到另一种,RNA-Seq都带来了许多显而易见的优势.这种方法不…
0.前言 虽然很早就知道R被微软收购,也很早知道R在统计分析处理方面很强大,开始一直没有行动过...直到 直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了.直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我.所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧. 说明:本文已经提交到github,地址:https:/…
生命的基本过程是从DNA转录成mRNA,再翻译成蛋白质发挥功能.DNA就像一张绝密的密码图,不能随意被移动,只能被锁在细胞核里.要想知道这些密码,只能像复印一样,将密码图复印到mRNA上,由它们把这些密码带到细胞质中进一步加工成蛋白质,让蛋白质发挥生物学功能.由于这些蛋白质是由mRNA所编码的,因此我们称这些mRNA为编码RNA:相反,那些不编码蛋白质的RNA被称为非编码RNA. 长期以来,非编码RNA以及被认为是基因组上的Junk或"暗物质",然而,随着2001年人类基因组测序的完成…
RNA测序研究现状与发展 1 2,584 A+ 所属分类:Transcriptomics   收  藏 通常来说,某一个物种体内所有细胞里含有的DNA都应该是一模一样的,只是因为每一种细胞里所表达的RNA之间存在差异,才使这些细胞有所区别.诸如“为什么肿瘤细胞与正常细胞会不一样?”这样的重要问题都可以通过对这些不同细胞里的RNA进行研究来解决,比如转录组学(transcriptome)研究就是一个很好的方法,而这就需要用到RNA测序技术.本期的<自然 方法>(Nature Methods)杂志…
StringTie 参考链接: https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual#input https://www.cnblogs.com/adawong/articles/7977314.html 参数简介 StringTie的基本用法: stringtie <aligned_reads.bam> [options]* 其中,aligned_reads.bam 是输入文件,该输入文件要求必须按其基因组位置排序, HISA…
 人类全基因组测序06 SNP(single nucleotide polymorphism):有了10倍以上的覆盖深度以后,来确认SNP信息,就相当可靠了. 一个普通黄种人的基因组,与hg19这个参考基因组序列相比,会有350万个左右的SNP.又有大概2万个是落在外显子上的,而非同义的SNP有大概9千个. 所谓非同义的SNP,就是这些SNP是会引起蛋白质的序列变化的. indel:(insertion & deletion)是指小于50个bp以内的微小的插入.和缺失突变.一个普通黄种人的基因组…
[翻译]Awesome R资源大全中文版来了,全球最火的R工具包一网打尽,超过300+工具,还在等什么? 阅读目录 0.前言 1.集成开发环境 2.语法 3.数据操作 4.图形显示 5.HTML部件 6.复用组件研究 7.Web技术和服务 8.并行计算 9.高性能 10.语言API 11.数据库管理 12.机器学习 13.自然语言处理 14.贝叶斯 15.最优化 16.金融 17.生物信息学 18.网络分析 19.R 开发 20.日志 21.数据包 22.其他工具 23.其他编译器 24.R学习…
featuresCounts 软件用于定量,不仅可以支持gene的定量,也支持exon, gene bodies, genomic bins, chromsomal locations的定量: 官网 : http://bioinf.wehi.edu.au/featureCounts/ 只需要输入reads的比对情况,就是BAM 文件,再输入一个你感兴趣的区间的注释(通常是基因或者转录本的注释gtf 文件,就可以了),所以不论是DNA seq 还是RNA seq, 这个软件都是可以定量的. fea…
这里有很多非常不错的R包和工具. 该想法来自于awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过这些翻译了解这些工具包,以后干活也就方便多了.不过翻译这个东西的确要靠耐心,翻译,编辑花费了至少一周的空余时间. 在编辑本文的过程中,惊喜的发现Awesome系列的其他资源:地址在github: 1.DotNet 资源大全中文版 2.Java资源大全中文版 3.JavaScript 资源大全中文版 一  集成开发环境 RStudio –…
单细胞在脑科学方面的应用 Session 1: Deciphering the Cellular Landscape of the Brain Using Single Cell Transcriptomics Single cell/nucleus transcriptomics has emerged as a powerful approach to classify cell types and dynamic cell states in any multicellular organ…
1.官网简介 http://cab.spbu.ru/software/quast-lg/ QUAST- lg是QUAST的一个扩展,用于评估大型基因组装配(直至哺乳动物大小).QUAST- lg从5.0.0版本开始包含在QUAST包中(下载最新版本).像往常一样运行QUAST,不要忘记在您的命令中添加‐large选项! 新功能的简短列表(参见所有更改): 通过使用新的快速比对(minimap2)和重构对齐分析模块,显著提高了速度 新的基于k-mer的评估基因组完整性和正确性度量 BUSCO增加了…
直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了.直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我.所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧. 这里有很多非常不错的R包和工具. 该想法来自于awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过…
.NET技术, 开源项目, 数据挖掘, 机器学习, 微软Power BI, 足球赛事分析, Matlab与C#编程 博客园 管理 本站首页 头条推荐 Power BI .NET开源 机器学习 博客美化 X组件 Matlab 随笔 - 189  文章 - 15  评论 - 4316 [翻译]Awesome R资源大全中文版来了,全球最火的R工具包一网打尽,超过300+工具,还在等什么? 阅读目录 0.前言 1.集成开发环境 2.语法 3.数据操作 4.图形显示 5.HTML部件 6.复用组件研究…
蕾妮·瓦林特(Renee Valint)的女儿谢尔碧(Shelby)在2000年出生时.看起来虚弱无力,就如同一仅仅耷拉着的布娃娃.谢尔碧学着走路和说话,但学得很慢.错过了儿童发展的重要阶段.到4岁时.她还仅仅能坐在轮椅上.到五年级时,她開始要用电子语音设备与人交流.绝望无助的蕾妮把女儿从菲尼克斯带到明尼苏达州罗切斯特的梅奥诊所(Mayo Clinic).进行最后一周的检查.并与美国最好的一些医生讨论病情. "他们都把手一摊,说:'我们不知道她出了什么问题.'"蕾妮说道,"那…
生物信息学 Sanger采用链终止法进行测序 带有荧光基团的ddXTP+其他四种普通的脱氧核苷酸放入同一个培养皿中,例如带有荧光基团的ddATP+普通的脱氧核苷酸A.T.C.G放入同一个培养皿,以此类推,存在4种不同类型碱基的识别机制,同时,该ddXTP一旦结合在互补链上则会迫使复制停止. 高通量测序是二代测序,先建库后测序: 建库方法: 单末端测序:将DNA双链打碎并接上接头序列,通过改变条件使双链变单链,将待测的单链固定在flowcell上,再加入游离的脱氧核苷酸,采用边合成边测序方法比配并…
这么多工具和基因组版本,选择困难症犯了,到底用哪个好呢? 2018 nature - Developmental diversification of cortical inhibitory interneurons : ENSEMBL release 84 Mus musculus genome 2017 Molecular Cell - Single-Cell Alternative Splicing Analysis with Expedition Reveals Splicing Dyn…
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做物种分类的Metataxanomics.鸟枪法打断全基因组DNA序列的Metagenomics和基于mRNA信息的宏转录组方法Meta-transcriptomics. 16S,也即是我们通常所说的微生物多样性,是一种相对快速和经济适用的方法,但是PCR导致了偏好的产生,这就降低了注释准确度.此外,…
SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图. 该软件特地设计用来组装Illumina GA short reads,新的版本减少了在图创建时的内存消耗,解决了contig组装时的重复区域的问题,增加了scaffold组装时的覆盖度和长度,改进了gap closing,更加适用于大型基因组组装. (SOAPdenovo是为了组装大型植物和动物基因组而设计的,同样也适用于组装细菌和真菌,组装大型基因组大小如人类时,可能需要150G内存…
  这是博客改版的第一篇博文,选择最近使用的生物信息学软件——circos开始写起.circos是用perl写的生物软件,从发表的文章来看 学习circos主要是熟悉配置文件的编辑方法,搞清楚其中的标签.参数的含义.只有完全清楚了这些东西才能够轻松自如的让circos绘制出主要用于基因组序列的可视化(绘制基因组圈图),至少目前我是用来干这个事情的.现在circos也被其他领域模仿用来做很多图形. 你想要的图片.如果你的英语基础还不错,推荐直接到官方网站看教程,一遍看教程一遍练习上手会很快(官方教…
1.Wireshark的数据包详情窗口,如果是用中括号[]括起来的,表示注释,在数据包中不占字节 2.在二进制窗口中,如“DD 3D”,表示两个字节,一个字节8位 3.TCP数据包中,seq表示这个包的序号,注意,这个序号不是按1递增的,而是按tcp包内数据字节长度加上,如包内数据是21字节,而当前IP1发到IP2的包的seq是10的话,那下个IP1发到IP2的包的seq就是10+21=31 4.注意我们分析tcp包时,要以一个会话做为一个完整对象,即通讯只发生在两个IP之间,两个固定的端口之间…
原文: http://blog.csdn.net/wang7dao/article/details/16805337/ ---------------------------------------------------------------------------------------- 1.Wireshark的数据包详情窗口,如果是用中括号[]括起来的,表示注释,在数据包中不占字节 2.在二进制窗口中,如“DD 3D”,表示两个字节,一个字节8位 3.TCP数据包中,seq表示这个包的…
http://ibl.mdanderson.org/tanric/_design/basic/index.html…
RNA-seq这个工具该什么时候用?ATAC-seq该什么时候用?有相当一部分项目设计不行,导致花大钱测了一些没有意义的数据. 还是在中心法则这个框架下来解释,这是生物信息的核心.打开华大科技服务官网梳理一下现在到底都有些什么测序技术: 全基因组测序和重测序 - 组装以及寻找变异 (外显子和目标区域测序) RNA-seq测序 - 基因表达 (smRNA,lncRNA,circRNA,PB全长,可变剪切) 甲基化测序 ChIP-seq和ATAC-seq 蛋白组 - 所有蛋白的变化 代谢组 - 植物…
注:这些工具的应用都是受限的,有些本来就是只能用于预测动物,在使用之前务必用ground truth数据来测试一些.我想预测某一个植物的转录本,所以可以拿已经注释得比较好的拟南芥来测试一下.(测试的结果还是比较惊人的) CPC (熟悉的名字,原来是北京大学的高歌.魏丽萍开发的) 搜文章时才发现2017年已经出了CPC2了 CPC可在线使用a Support Vector Machine-based classifier, named Coding Potential Calculator (CP…
转录组分析---Hisat2+StringTie+Ballgown使用 (2016-10-10 08:14:45) 转载▼ 标签: 生物信息学 转录组   1.Hisat2建立基因组索引: First, using the python scripts included in the HISAT2 package, extract splice-site and exon information from the gene annotation file:   $ extract_splice_…