单细胞测序 单细胞基因组学 测量理由是单细胞的时间空间特异性. Gene expression&co-expression 比较正常cell与疾病cell,正常organ与疾病organ,看出偏差. 分离单细胞,破碎细胞,RNA逆转录,测量cDNA. Eg:BAC扩增,可以实现bias很小的的genome,genome质量高. Eg:对sperm cell进行single cell, Eg:oocyte与sperm结合后,可以对过程中丢弃的部分进行single cell. 如果父源或母源中任何一…
单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向.在这一领域中,最前沿的则是单细胞测序技术.传统测序方法一次处理成千上万个细胞,得到的变异水平也是成千上万个细胞的平均后水平.但是,就如同世界上没有完全相同的两片树叶一样,没有两个细胞是完全相同的.所以,单细胞测序对于研究单个细胞就显得至关重要. 单细胞测序可以揭示出每个细胞独特的微妙变化,甚至可以…
细胞状态转换轨迹构建示意图(Trapnell et al. Nature Biotechnology, 2014) 在各种生物系统中,细胞都会展现出一系列的不同状态(如基因表达的动态变化等),这些状态(state)之间会按照一定的时间顺序转换.最典型的比如细胞的分化过程,从不成熟的细胞逐渐分化为成熟细胞.此外,细胞在受到外界刺激或扰动时,细胞内基因的表达也可能发生一系列的变化,从而呈现出一系列状态的转换. 这些特别提一下,细胞状态(cell state)和细胞亚型(cell subtype)是两…
本文总结自一篇综述: Computational approaches for interpreting scRNA-seq data 单细胞分析分为两个层次: cell level gene level Tools for the visualization and clustering of cells. Tools for the ordering of cells & bifurcation/branch identification Tools for gene-level analy…
单细胞测序流程(http://learn.gencore.bio.nyu.edu) 在过去的十多年里,高通量测序技术被广泛应用于生物和医学的各种领域,极大促进了相关的研究和应用.其中转录组测序(RNA-seq)被广泛应用于测定和描绘各类物种的基因或转录本的表达情况.但传统的转录组测序技术(bulk RNA-seq)是基于群体细胞,每个样本包含成千上万个细胞,所以最终反映的是基因在群体细胞中平均表达水平,从而掩盖了不同细胞之间的表达异质性.近年来,单细胞转录组测序(single-cell RNA-…
可变剪接(alternative splicing),在真核生物中是一种非常基本的生物学事件.即基因转录后,先产生初始RNA或称作RNA前体,然后再通过可变剪接方式,选择性的把不同的外显子进行重连,从而产生不同的剪接异构体(isoform).这种方式,使得一个基因可产生多个不同的转录本,这些转录本分别在细胞/个体分化发育的不同阶段,在不同的组织中有各自特异的表达和功能,从而极大地丰富了编码RNA和非编码RNA种类和数量,进而增加了转录组和蛋白质组的复杂性. 可变剪接主要有以下五种常见的形式: 1…
单细胞RNA测序技术之入门指南 [字体: 大 中 小 ] 时间:2018年09月12日 来源:生物通   编辑推荐: 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为“实验室中的家常菜”.若要评选出目前最受欢迎的一道菜,那恐怕非单细胞RNA测序莫属. 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为“实验室中的家常菜”.若要评选出目前最受欢迎的一道菜,那恐怕非单细胞RNA测序莫属. 以往,研究人员通常利用RNA测序(RNA-seq)来检测样本中的所有RNA转录本,以发现新型RNA…
许多分析软件 : https://github.com/seandavi/awesome-single-cell#software-packages Smart-seq.CEL-seq.SCRB-seq和Drop-seq.Smart-seqSMART(Switching mechanism at 5’ end of the RNA transcript)是一个具有里程碑意义的重要技术.实际上,能够从单细胞生成全长cDNA的测序方案并不多,Smart-seq就是其中之一.对于等位基因特异性表达或者…
这是一个新系列 差不多是一年以前,我定导后没多久,接手了读研后的第一个课题.合作方是医院,和我对接的是一名博一的医学生,最开始两边的老师很排斥常规的单细胞文章思路,即各大类细胞分群.注释.描述,所以起初的几个月都在摸索一条主线,再后来有主线了,要加实验验证,周期有点长.我这边的分析基本做完.读研生活还在继续,我也不能太在意这一个课题,尽管有些时候我也很着急,尽管我在这个课题上花了很多时间.整理分析流程是个好习惯,最大的受益者还是自己,所以接下来我打算把我在处理单细胞转录组过程中,学到的用到的所有…
灵敏度高 == 假阴性率低,即漏检率低,即有病人却没有发现出来的概率低. 用于判断:有一部分人患有一种疾病,某种检验方法可以在人群中检出多少个病人来. 特异性高 == 假阳性率低,即错把健康判定为病人的概率低. 用于:被某种试验判定为患病的人中,又有多少是真的患了这种病的. 好的检测方法:有高的灵敏度(低的假阴性率).同时又有高的特异性(低的假阳性率). ROC 曲线: 横轴:100 — 特异性..即100减去特异性,特异性高,100减去特异性就低,故越小越好. 纵轴:灵敏度值. ROC分析图的…
Cell Ranger是一个"傻瓜"软件,你只需提供原始的fastq文件,它就会返回feature-barcode表达矩阵.为啥不说是gene-cell,举个例子,cell hashing数据得到的矩阵还有tag行,而列也不能肯定就是一个cell,可能考虑到这个才不叫gene-cell矩阵吧~它是10xgenomics提供的官方比对定量软件,有四个子命令,我只用过cellranger count,另外三个cellranger mkfastq.cellranger aggr.cellra…
Quantitative single-cell rna-seq with unique molecular identifers 这篇文章论证了 scRNA-seq 使用UMI来计算基因表达量的合理性和优势. 这里主要研究如何分析 scRNA-seq 的数据,如何处理ERCC和UMI. 背景: however, losses in cdna synthesis and bias in cdna amplifcation lead to severe quantitative errors. 单…
单细胞流程跑了不少,但依旧看不懂结果,是该好好补补了. 有些人可能会误会,觉得单细胞的RNA-seq数据很好分析,跟分析常规的RNA-seq应该没什么区别.今天的这篇文章2015年3月发表在Nature Genetics Review上,专门说明了一下单细胞RNA测序数据在数据分析和计算上的挑战(虽然已经过去1年多了,这里指出的问题和挑战仍然是不过时的,至于这些问题和挑战现在是不是完美解决了,这里就暂且先不讨论了.). 主要说了以下问题: 1. 单细胞RNA测序 (single cell RNA…
最近Cell Systems杂志发表了一篇针对现有几种检测单细胞测序doublet的工具的评估文章,系统比较了常见的例如Scrublet.DoubletFinder等工具在检测准确性.计算效率等方面的优劣,以及比较了使用不同方法去除doublet后对下游DE分析.轨迹分析的影响. 现有的检测方法,基本都会先构造出虚拟doublet,然后将候选droplet与这些虚拟doublet比较,很相似的那些就定义为doublet.这里的虚拟doublet是通过随机组合两个(类)细胞的表达值得到的虚拟的do…
DGE-seq和普通的transcriptomic profiling相比较有什么不同,有什么特点? DGE就是用酶将mRNA切断,只使用靠近poly A的一小段RNA去测序. #1 由于不是测定mRNA的全长,DGE的数据量比转录组要小一些: #2 DGE比转录组价格低一些: #3 DGE和转录组都可以分析所有基因的表达丰度,并且比较组间基因表达差异: #4 转录组还可以分析SNP.RNA editing.splicing.gene fusion等:而DGE不适宜做这些分析. 转录组测序和数字…
转自公众号Eric生信小班.学习群体遗传套路 中科院昆明动物园吴东东研究团队联合国外研究团队2019年在Genome Biology发表题为Whole genomes and transcriptomes reveal adaptation and domestication of pistachio的研究论文,利用全基因组和转录组数据,系统研究了开心果在驯化与环境适应上的遗传机制,研究内容和方法采用群体基因组学的常规分析,包括基因组de novo.转录组.群体进化.选择位点分析,可作为群体基因…
全基因组测序 全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序,利用生物信息学分析方法进行拼接.组装,获得该物种的基因组序列图谱,从而推进该物种的后续研究.基因组重测序 是对有参考基因组物种的不同个体进行的基因组测序,并在此基础上对个体或群体进行差异性分析. 基因组重测序主要用于辅助研究者发现单核苷酸多态性位点(SNPs).拷贝数变异(CNV).插入/缺失(I…
转录组分析综述 转录组 文献解读 Trinity cufflinks 转录组研究综述文章解读 今天介绍下小编最近阅读的关于RNA-seq分析的文章,文章发在Genome Biology 上的A survey of best practices for RNA-seq data analysis .由于文章较长和枯燥,小编认为重要的信息,已经加粗加红,可以直接看重要信息.不要问我为啥这么好,请叫我雷锋. 摘要 现在RNA-seq数据使用广泛,但是没有一套流程可以解决所有的问题.我们重点关注RNA-…
第三章 RNA测序   RNA测序(RNA Sequencing,简称RNA-Seq,也被称为全转录物组鸟枪法测序Whole Transcriptome Shotgun Sequencing,简称WTSS),是基于二代测序技术研究转录组学的方法,可以快速获取给定时刻的一个基因组中RNA的种类和数量. RNA-Seq有助于查看基因的不同转录本.转录后修饰.基因融合.突变/SNP和基因表达随时间的变化,或在不同组中基因表达的差异. RNA-Seq除了可以查看mRNA转录本,还可以查看总RNA.小RN…
RNA-seq这个工具该什么时候用?ATAC-seq该什么时候用?有相当一部分项目设计不行,导致花大钱测了一些没有意义的数据. 还是在中心法则这个框架下来解释,这是生物信息的核心.打开华大科技服务官网梳理一下现在到底都有些什么测序技术: 全基因组测序和重测序 - 组装以及寻找变异 (外显子和目标区域测序) RNA-seq测序 - 基因表达 (smRNA,lncRNA,circRNA,PB全长,可变剪切) 甲基化测序 ChIP-seq和ATAC-seq 蛋白组 - 所有蛋白的变化 代谢组 - 植物…
目录 研究一:G19833组装,2014NG 研究二:BAT 93组装,2016 genome biology 菜豆属(Phaseolus L.)为同源二倍体作物,包含有80 多个物种,多数为野生种,仅有5 个栽培种,分别为普通菜豆(P. vulgaris L.).多花菜豆(P. cocineus L.).利马豆(P. lunatus L.).丛林菜豆(P. dumosus L.)和宽叶菜豆(P. acutifolius L.),其中普通菜豆在世界范围内种植范围最广.栽培面积最大.食用人群最多.…
概念 利用蛋白质组学数据,结合基因组数据(DNA).转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学."蛋白质基因组学"一词由Jaffe 等于2004 年首次提出,作者采用串联质谱数据匹配DNA翻译得到氨基酸序列的方法,在仅有810 kb 大小的细菌基因组上直接鉴定开放阅读框(open reading frame,ORF),验证并补充.修订了约10%的ORF.后来这种质谱数据结合DNA 和RNA 数据的分析方法被应用到注释病毒基因组.原核生物基因组以及真核生物基因组. 本…
转录组的组装Stingtie和Cufflinks Posted: 十月 18, 2017  Under: Transcriptomics  By Kai  no Comments 首先这两款软件都是用于基于参考基因组的转录组组装,当然也可用于转录本的定量.前者于2016年的 protocol上发表的转录组流程HISAT, StringTie and Ballgown后被广泛使用,后者则是老牌的RNA分析软件了.在算法上来说Stringtie使用的是流神经网络算法,Cufflinks则是吝啬算法:…
原文网址: http://blog.biochen.com/archives/337 HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2.官网:https://ccb.jhu.edu/software/hisat2/index.shtml HISAT2安装 下载HISAT2-2.0.1,并解压: unzip hisat2-2.0.1-beta-Linux_x86_64…
Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和自由分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据. 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式. GEO的数据储存方式 GEO数据库具体存放四类数据:GSE.GDS.GSM.和GPL. 一个GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台: 一个GDS号(GDSxxx)对应的一个同一平台的数据集…
针对PacBio单分子测序——第三代测序技术的测序原理和读长     DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业.测序技术的应用也扩展到了生物.医学.制药.健康.农林.园艺.花卉.环保.法医等许多领域,并成为一项与我们衣食住行密切相关的高技术产业.据最新统计,2012年全球基因测序市场的产值已超过百亿,按最近几年增长速度,预计2017年市场产值将加倍.因此可以说,基因测序在我国生物科技领域具有非常重要的战略意义.        “第三代测序技术”的…
目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki bean (Vigna angularis) provides insight into high starch and low fat accumulation and domestication 二.研究一(小豆基因组草图) 基因组组装 基因与重复序列预测 小豆驯化痕迹 标记开发及育种应用 红豆基因…
目录 流程使用 问题 记录下braker2的使用要点,以备忘记. 流程使用 braker2有很多流程,根据你的数据:组装的基因组.转录组.蛋白(同源,包括近缘或远缘)选择不同流程,官网有说明: https://github.com/Gaius-Augustus/BRAKER 现在的动植物组装,大多数都含有以上三类数据吧,因此可选择如下流程,用公共数据库OrthoDB中的直系同源蛋白,根据自己的物种选择,有动物植物微生物等,如我选择植物就有300多万条序列. 作者指出,braker2并非证据越多越…
目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4)质控.基因组组装.质量评估 5)基因组注释 6)生物学分析 7)更多参考内容 5. 动植物Denovo测序项目的主要分析内容 1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法.基于OLC的…
NGS又称为下一代测序技术,高通量测序技术 以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可大大降低测序费用.缩短测序时间的测序技术. Sanger法测序(一代测序):是一种利用DNA聚合酶来延伸结合在待定序列模板上的引物的测序技术.每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP).由于ddNTP缺乏延伸所需要的3-OH基团,使延长的…