The single-cell transcriptional landscape of mammalian organogenesis

老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想象得,想想如何把我们的数据和他们的数据整合到一起。

文献阅读 | Molecular Architecture of the Mouse Nervous System 这篇侧重强调的是神经系统的单细胞发育过程测序。

Mouse Organogenesis Cell Atlas (MOCA) - 所有数据均可下载

sci-hub

这个数据可以挖掘的东西有很多,我的DPR可以挖出很多有意思的东西。

we profiled the transcriptomes of around 2 million cells derived from 61 embryos staged between 9.5 and 13.5 days of gestation, in a single experiment.

测了2百万个细胞,61个胚胎样本,4天的核心胚胎发育历程。

下面这张图基本就是本文的核心了,不同stage,不同subtype,不同的trajectory。

背景

之前的mouse scRNA-seq数据库

结果解读

Single-cell RNA-seq of two million cells

问题:

1. 测了什么细胞?

这篇文章不像那篇mouse Brain Atlas,本文测了四天的胚胎发育的所有细胞,没有解剖分区,没有FACS sorting,没错,全测。

We collected 61 C57BL/6 mouse embryos at E9.5, E10.5, E11.5, E12.5 or E13.5

5个发育天,所以总体有五个阶段,但是每个阶段取了多个样本,一共61个样本。

As a control, we spiked a mixture of human HEK-293T and mouse NIH/3T3 nuclei into two wells. 对照

2. 怎么测得?上面的图解释得很直观,index建好了,最终一个nova-seq直接测完,震撼。

3. 为什么只测nuclei?bais更小,可以直接测冷冻的样品。有相关文章:Single-nucleus and single-cell transcriptomes compared in matched cortical cell types

4. 一些震惊的问题?

过滤的阈值非常低,UMI (unique molecular identifier) count ≥ 200,这岂不是有严重的偏差?

只有7%的细胞被测到,大部分都在建库的时候过滤掉了;

其实还好,平均一个胚胎测了30w个细胞,我们的一个sorting后的E13.5的ENCC都能测1w个。

一个细胞测这么少的reads,只检测到500个基因,确定这种数据可用吗?

答案是:数据有很强的特性,从中可以获取某些信息,但肯定的是,更多的信息被丢失了,所以别指望这个数据是万能的。

Identification of cell types and subtypes

这部分没啥意思,就是把所有的阶段混在一起聚类,找marker,人工定义每个cluster。

总觉得人工找的不可靠,或多或少会有偏向性和谬误,最少目前我们的认知是有限的。

Characterization of the apical ectodermal ridge

分析了一个特例,没有太多的意思。

Reconstructing developmental trajectories

十个主要的发育路径

一起测序的,数据不好分离,不知道里面哪些数据对我们有用,PNS和ENS应该不是一个东西。

十个主要发育路径底下的子路径

Reconstructing skeletal myogenesis

另一个特例。

优势分析:

  • 通量大,200万个细胞
  • 覆盖了关键的4天,E9.5-E13.5
  • 适配的分析方法,大数据的处理方法
  • 关键的subtype和lineage都有所揭示
  • 公开了所有的数据

缺点:

  • 浪费了太多细胞
  • 分辨率太低,单个细胞检测到的基因和UMIs太低
  • 某些精细的分析根本无法完成

ENS数据下载:

先下载细胞的注释文件,找出与enteric有关的细胞;

https://oncoscape.v3.sttrcancer.org/atlas.gs.washington.edu.mouse.rna/downloads

然后再下载monocle的cds文件,提取需要的raw data。

不要用浏览器下载,用wget

wget https://shendure-web.gs.washington.edu/content/members/cao1025/public/mouse_embryo_atlas/cds_cleaned.RDS

文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组的更多相关文章

  1. 文献阅读 | Benchmarking single cell RNA-sequencing analysis pipelines using mixture control experiments

    资源: sci-hub paper CellBench package - github CellBench_data - code for the paper 现在单细胞领域的突出问题就是工具过多, ...

  2. Advances in Single Cell Genomics to Study Brain Cell Types | 会议概览

    单细胞在脑科学方面的应用 Session 1: Deciphering the Cellular Landscape of the Brain Using Single Cell Transcript ...

  3. 单细胞测序技术(single cell sequencing)

    单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向 ...

  4. 文献阅读笔记——group sparsity and geometry constrained dictionary

    周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...

  5. 单细胞参考文献 single cell

    许多分析软件 : https://github.com/seandavi/awesome-single-cell#software-packages Smart-seq.CEL-seq.SCRB-se ...

  6. Analysis of single cell RNA-seq data(单细胞终极课程)

    业界良心啊,开源的单细胞课程. 随便看了几章,课程写得非常用心,非常适合新手. 课程地址:Analysis of single cell RNA-seq data 源码地址:hemberg-lab/s ...

  7. Multiclonal Invasion in Breast Tumors Identified by Topographic Single Cell Sequencing

    Title:  Multiclonal Invasion in Breast Tumors Identified by Topographic Single Cell Sequencing 课题的目的 ...

  8. Single Cell Genomics Day: A Practical Workshop

    干货满满! Single Cell Genomics Day: A Practical Workshop

  9. CAR-T|Single cell plan|Extracellular RNA|

    生物医疗大数据 安吉丽娜朱莉发现抑癌基因事件,BRCA突变与乳腺癌关联. 个体化测序商品23 and me 多组学数据研究:eg:太空和地球双胞胎发现生化指标差不多. 研究模式和工业模式相结合. 研究 ...

随机推荐

  1. LINQ to Entities 不识别方法“System.String ToString(System.String)”,因此该方法无法转换为存储表达式。

    来源:https://www.cnblogs.com/hao-1234-1234/p/9112434.html 6  Select的时候,时间无法转换成 年月日  YYMMMdd 报错:LINQ to ...

  2. 0001-代码仓库-git 命令

    参考 https://www.cnblogs.com/NTWang/p/6213408.html https://www.cnblogs.com/Sungeek/p/6905102.html

  3. 【转】如何使用jupyter编写数学公式(译)

    [1.如何使用jupyter编写数学公式(译)][1] [1]: https://www.jianshu.com/p/93ccc63e5a1b

  4. sqoop 导入增量数据到hive

    版本 hive:apache-hive-2.1.0 sqoop:sqoop-1.4.6 hadoop:hadoop-2.7.3 导入方式 1.append方式 2.lastmodified方式,必须要 ...

  5. kvm虚拟化环境中的时区设置

    guest OS时间保持 kvm技术是全虚拟化,guest OS并不需要做修改就可以直接运行,然而在计时方面却存在问题,guest OS计时的一种方式是通过时钟中断计数,进而换算得到,但host产生的 ...

  6. IDEA中看Flink 1.9源码时报Sources not found for: org.apache.flink:flink-shaded-hadoop-2:2.4.1-7.0

    1.场景 在阅读Flink 1.9源码时,个别类如YarnClientImpl.java只能查看.class文件,想查看对应的.java source文件,点击Download source时,报So ...

  7. ASP.NET Core3.0 中的运行时编译

    运行时编译 通过 Razor 文件的运行时编译补充生成时编译. 当 .cshtml 文件的内容发生更改时,ASP.NET Core MVC 将重新编译 Razor 文件 . 通过 Razor 文件的运 ...

  8. gdb, pdb笔记

    gdb gdb --args yourprogram 常用命令 r(run):从头开始运行 c(continue):继续运行 b(breakpoint) filepath:line or namesp ...

  9. spark如何划分DAG视图

    spark根据宽依赖进行DAG视图的划分. 1.窄依赖:每个父RDD的partition 最多被一个子RDD的 partition使用. 窄依赖分为两类:第一类是一对一的依赖关系,在Spark中用On ...

  10. HttpMessageConverter(消息转换器 )和@responsebody使用(转)

    @responsebody表示该方法的返回结果直接写入HTTP response body中 一般在异步获取数据时使用,在使用@RequestMapping后,返回值通常解析为跳转路径,加上@resp ...