文章亮点:

按level来管理和分析数据,文章有不同stage,每个stage有不同subtype,这应该是一个真tree,而不只是一个进化树,文章里出现最多的进化树把所有的stage都整合了。

空间归类和taxonomy的工作,mapped cell types spatially and derived a hierarchical, data-driven taxonomy

神经元按解剖单元和递质类型归类;Neurons were the most diverse and were grouped by developmental anatomical units and by the expression of neurotransmitters and neuropeptides.

背景常识:

Neuronal diversity was driven by genes encoding cell identity, synaptic connectivity, neurotransmission, and membrane conductance.

先去看下科普视频,不然都不认识文章里面的各种名词。

这篇文章的侧重点在于CNS和发育,所以花了很大篇幅来用Dendrogram阐述Taxonomy。但我觉得这个系统树其实是失败的,太着重于subtype,而忽略了stage。其实也是算法的局限。

这种大数据的管理是真的难,管理架构不行,后面分析就举步维艰。本文的数据管理策略值得学习。

Molecular Architecture of the Mouse Nervous System - Sten Linnarsson

Mouse brain atlas - 对应的数据库

问题

1. 测了什么细胞?测了多少个细胞?

很明确,这篇文章关注的重点是Mouse Nervous System老鼠神经系统;那么是哪个阶段的呢?In summary, male and female mice were postnatal ages P12-30, as well as 6 and 8 weeks old. 明显得老鼠成熟了才有CNS和PNS,文章称是刚刚成型的老鼠神经系统adolescent mouse nervous system。测了50万个细胞,最新的4个胚胎发育天E9.5-E13.5测了200万个

We performed a comprehensive survey of the adolescent mouse nervous system by scRNA-seq. We dissected the brain and spinal cord into contiguous anatomical regions and further included the peripheral sensory, enteric, and sympathetic nervous system. In total, we analyzed 19 regions (Figure 1A) but omitted at least the retina, the olfactory epithelium, the vomeronasal organ, the inner ear, and the parasympathetic ganglia.

这里不是全部混合测序,建库之前就按解剖学分区了,分成了19个区,但是也忽略了一些特定的区域。

总体而言,测了CNS、PNS和ENS。

这次测序用的是商业的droplet microfluidics (10X Genomics Chromium),估计花了不少钱,后面就自己开发了 SPLiT-seq。

结果

A Molecular Survey of the Mouse Nervous System

In addition, the dataset was affected by a number of technical artifacts, including low-quality cells, batch effects, sex-specific gene expression, neuronal-activity-dependent gene expression, and more.

To overcome these challenges, we developed a multistage analysis pipeline called “cytograph,” which progressively discovers cell types or states while mitigating the impact of technical artifacts

cytograph,我很感兴趣,整合的算法,但是本文没怎么提及,因为还没有发表。在这个R统一了生物信息的时代,他们组还是坚持用python。

这个课题组还是要用loom,确实很不方便,不仅跨平台,而且要学习一个新的工具。

更新:查了下,loom还是有好处的,它是一个数据库数据结构,适用于超大数据,数据只存储于磁盘上,内存放不下,需要时才会调用,而且是分chunk

Loom files are stored on disk and are never loaded entirely. They are more like databases: you connect, retrieve some subset of the data, maybe update some attributes.

loom更像是纯粹的最终读取文件,edit loom文件非常不方便。

一个现有的矛盾就是,我们的所有数据分析都是在R里用R包跑出来的,loom是用Python开发的,对R的支持非常不好。想把loom里面的数据都导出来真的很费力。

以下代码可以在普通电脑上操作,不用担心内存不足。

import loompy
import pandas as pd
ds = loompy.connect("l5_all.loom")
# ds2 <- ds[:, ds.ca.Tissue == "ENS"]
# ds.ca.keys()
# ds.ra['ClusterName', 'Clusters', "CellID"] data = {"CellID":ds.ca.CellID, "ClusterName":ds.ca.ClusterName, "Clusters":ds.ca.Clusters, "Tissue":ds.ca.Tissue}
df = pd.DataFrame(data)
df.to_csv("cellID.clusterName.csv")

Postnatal Neurogenesis in the Central Nervous System

Astroependymal Cells Are Diverse and Spatially Patterned

Loss of Patterning in the Oligodendrocyte Lineage and Convergence to a Single Brain-wide Intermediate State

Vascular Cells and a Family of Broadly Distributed Mesothelial Fibroblasts

Neural-Crest-Derived Glia and Oligodendrocyte Progenitors

Peripheral Nervous System

Central Nervous Systems Neurons

Spatial Distributions Reflect Molecular Diversity

Drivers of Neuronal and Glial Diversity

里面的postonal embryogenesis的数据对我们很有用!

数据下载

读取和操作loom数据

R包 loomR 不好用,标准不够统一。

下载我感兴趣的ENS的文件:

http://mousebrain.org/tissues.html

细胞的注释信息则从总的loom文件中提取(如上)。

文献阅读 | Molecular Architecture of the Mouse Nervous System的更多相关文章

  1. 文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组

    The single-cell transcriptional landscape of mammalian organogenesis 老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想 ...

  2. 文献阅读笔记——group sparsity and geometry constrained dictionary

    周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...

  3. 文献阅读 | Epigenetics in ENS development and Hirschsprung disease

    系列篇: Epigenetics in ENS development and Hirschsprung disease - Review Epigenetic Mechanisms in Hirsc ...

  4. 文献阅读 | A single-cell molecular map of mouse gastrulation and early organogenesis

    A single-cell molecular map of mouse gastrulation and early organogenesis Here we report the transcr ...

  5. phd文献阅读日志-博一上学期

    为了记住并提醒自己阅读文献,进行了记录(这些论文都是我看过理解的),论文一直在更新中. 博一上学期: 1.week 6,2017.10.16 2014-Automatic Semantic Model ...

  6. AutoML文献阅读

    逐步会更新阅读过的AutoML文献(其实是NAS),以及自己的一些思考 Progressive Neural Architecture Search,2018ECCV的文章: 目的是:Speed up ...

  7. 空间插值文献阅读(Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall)

    空间插值技术应用必读论文---P. Goovaerts, Geostatistical approaches for incorporating elevation into the spatial ...

  8. 人体姿势识别,Convolutional pose machines文献阅读笔记。

    开源实现 https://github.com/shihenw/convolutional-pose-machines-release(caffe版本) https://github.com/psyc ...

  9. 文献阅读方法 & 如何阅读英文文献 - 施一公(转)

    附: 如何看懂英文文献?(好) 看需求,分层次 如何总结和整理学术文献? Mendeley & Everything 如何在pdf文献上做笔记?福晰阅读器 自己感悟: 一篇专业文献通常会有几页 ...

随机推荐

  1. Python——元组

    是为了满足,某些值当被定义以后就不可修改或删除而出现的元组形式. 特点: 元组中的元素不可被修改或删除 没有独立的功能 可以进行嵌套,当嵌套方可以修改删除时,可以对嵌套方进行. 元组可以进行公共功能中 ...

  2. 利用Python openpyxl操作Excel

    from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = ...

  3. new 运算符的原理

    关于 new 运算符的原理: 1.红宝书上解释: (1)创建一个新对象 (2)将构造函数的作用域赋给新对象 (3)执行构造函数中的代码 (4)返回新对象 2.MDN上的解释: (1)一个继承自 Foo ...

  4. Python的安装以及编译器推荐

    1.Python的安装和环境配置 1.首先进入Python官网https://www.python.org/downloads/下载安装文件. 2.打开安装文件选择自定义(customize inst ...

  5. 《少年先疯队》第八次团队作业:Alpha冲刺第四天

    前言    第四天冲刺会议    时间:2019.6.17    地点:宿舍 4.1 今日完成任务情况以及遇到的问题.   4.1.1今日完成任务情况 姚玉婷:管理员功能模块中,收费管理功能的实现. ...

  6. 「NOI2016」循环之美

    P1587 [NOI2016]循环之美 题目描述 牛牛是一个热爱算法设计的高中生.在他设计的算法中,常常会使用带小数的数进行计算.牛牛认为,如果在 $k$ 进制下,一个数的小数部分是纯循环的,那么它就 ...

  7. (java)selenium webdriver学习--打开新窗口,并判断新窗口是否与目标窗口一致

    描述:selenium webdriver学习--打开新窗口,并判断新窗口是否与目标窗口一致,若一致则切换到该窗口并获取标题 跳出if判断,获取父级标题,并关闭 HTML标签不太明显时,可以用路径表示 ...

  8. MySQL 优化之EXPLAIN详解(执行计划)

    学习MySQL时我们都知道索引对于一个SQL的优化很重要,而EXPLAIN关键字在分析是否正确以及高效的增加了索引时起到关键性的作用. 这篇文章显示了如何调用“EXPLAIN”来获取关于查询执行计划的 ...

  9. MongoDB 复制集监控

    1.复制集状态查询:rs.status() 2.查看当前副本集oplog状态:rs.printReplicationInfo() 3.查看复制延迟:rs.printSlaveReplicationIn ...

  10. Kubernetes 学习8 Pod控制器

    一.回顾 1.Pod是标准的kubernetes资源,因此其遵循为其资源清单配置定义的基本格式,包含:apiVersion,kind,metadata,spec,status(只读) 2.spec的内 ...