• 作者:starlitnightly
  • 日期:2023.07.14

!!! note 楔子

从事单细胞分析也有一段时间了,国内大部分中文教程都是使用R语言进行分析,使用Python的还比较少,或者是直译scanpy的教程,不过scanpy可能已经比较旧了。在这里,我们参考了Single cell best practice,希望能给国内的从业者带来一个完善的教程指引以及分析。

简介

人体是一个复杂的机器,严重依赖于生命的基本单位——细胞。细胞可以分为不同类型,在发育过程中甚至会发生转变,在疾病或再生时也会如此。这种细胞的异质性在形态、功能和基因表达谱上都有所体现。强烈的干扰会导致细胞类型的紊乱,从而影响整个系统,甚至引发像癌症这样严重的疾病[Macaulay等人,2017]。因此,了解细胞在正常状态和干扰下的行为对于改善我们对整个细胞系统的理解至关重要。

这项庞大的任务可以通过不同的方式来解决,其中最有前途的方法是在个体水平上对细胞进行分析。到目前为止,每个细胞的转录组主要是通过一种称为单细胞RNA测序的过程来检测的。随着单细胞基因组学的最新进展,现在可以将转录组信息与空间、染色质可及性或蛋白质信息结合起来。这些进展不仅可以揭示复杂的调控机制,而且还增加了数据分析师的复杂性。

如今,数据分析师面临着一个庞大的分析工具领域,其中包含1000多种计算单细胞分析方法。在这个广泛的工具范围中导航以生成科学前沿的可靠结果变得越来越具有挑战性。

本书内容概述

本书的目标是教新手和专业人士单细胞测序分析的最佳实践,在Python中。本书将教您从预处理到可视化、统计评估等一系列常见的分析步骤,以及更深入的内容。通读本书将使您能够独立分析单模态和多模态单细胞测序数据。本书中的指南和建议不仅旨在教授您如何进行单细胞分析,而且着重于如何正确进行分析。我们的建议尽可能地基于外部基准和评价。最后,我们将本书视为单细胞数据分析师的一份实用资源,可以在推荐发生变化时轻松更新。

本书内容不涉及

本书不涵盖生物学或计算机科学的基础知识,包括编程。此外,本书也不是为特定任务设计的所有分析工具的完整集合。我们特别强调那些经过外部验证的工具,这些工具在处理手头的数据时效果最佳,或者是经过社区验证的最佳实践方法。如果不可能进行外部验证,我们只会基于自己广泛的经验推荐工作流程。

本书的结构

本书的每一章对应于典型单细胞数据分析项目的不同阶段。通常,分析工作流程会按照章节的顺序进行,但在下游分析目标方面可能存在一定的灵活性。我们的每一章都包含了大量的参考文献,我们鼓励读者查阅我们陈述观点的原始来源。尽管我们在可能的情况下试图提供所需的背景知识,但我们的总结并不能始终捕捉到我们推荐的全部理由。

学习前准备

生物信息学对于新手来说是一个具有挑战性的研究领域,因为它需要对生物学和计算机科学都有一定的了解。而单细胞分析则更加具有要求,因为它结合了许多子领域,而且数据集通常较大。本书无法涵盖计算单细胞分析的所有先决条件,因此我们建议您在下面对各种主题进行粗略的概述。以下链接可能会提升您在本书中的学习体验:

基本的Python编程。您应该熟悉控制流程(循环、条件语句等)、基本数据结构(列表、字典、集合)以及最常用库(如Pandas和Numpy)的核心功能。如果您对编程和Python还不熟悉,我们强烈推荐北京理工大学的嵩天老师的Python相关的mooc,包括Python基础学习Python数据处理与可视化两节。

了解AnnData和scanpy包的基础知识会有益,但不是绝对必需的。本书对AnnData的介绍足以让您跟上,并介绍了使用scanpy的工作流程。然而,我们无法在本书的过程中介绍scanpy的所有功能。如果您对scanpy还不熟悉,我们强烈建议您通过学习scanpy教程,并偶尔查看scanpy的API参考来学习。

如果您对多模态数据分析感兴趣,建议了解muon和MuData的基础知识。本书对MuData进行了更详细的介绍,但只是简要介绍了muon,类似于AnnData和scanpy。muon教程是学习使用muon进行多模态数据分析的很好入门资料。

生物学基础知识。虽然我们大致介绍了数据的产生过程,但我们不会涵盖DNA、RNA和蛋白质的基础知识。如果您对分子生物学完全不熟悉,建议阅读Bruce Alberts等人的《细胞分子生物学》(Molecular Biology of the Cell)。

License

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。在此再次感谢Single-cell best practices对单细胞教程的贡献,本书将基于Single-cell best practices结合作者自身的分析经验来完成。

【楔子】单细胞测序-最佳的分析Pipeline的更多相关文章

  1. 单细胞测序技术(single cell sequencing)

    单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向 ...

  2. 基于单细胞测序数据构建细胞状态转换轨迹(cell trajectory)方法总结

    细胞状态转换轨迹构建示意图(Trapnell et al. Nature Biotechnology, 2014) 在各种生物系统中,细胞都会展现出一系列的不同状态(如基因表达的动态变化等),这些状态 ...

  3. 单细胞测序|单细胞基因组|单细胞转录组|Gene editing|

    单细胞测序 单细胞基因组学 测量理由是单细胞的时间空间特异性. Gene expression&co-expression 比较正常cell与疾病cell,正常organ与疾病organ,看出 ...

  4. scRNA-seq单细胞测序数据分析工具汇总

    本文总结自一篇综述: Computational approaches for interpreting scRNA-seq data 单细胞分析分为两个层次: cell level gene lev ...

  5. JavaScript Web 应用最佳实践分析

    [编者按]本文作者为 Mathias Schäfer,旨在回顾在客户端大量使用JavaScript 的最佳 Web应用实践.文章系国内 ITOM 管理平台 OneAPM 编译呈现. 对笔者来说,Jav ...

  6. 使用RSEM进行转录组测序的差异表达分析

    仍然是两年前的笔记 1. prepare-reference 如果用RSEM对比对后的bam进行转录本定量,则在比对过程中要确保比对用到的索引是由rsem-prepare-reference产生的. ...

  7. 单细胞转录组测序数据的可变剪接(alternative splicing)分析方法总结

    可变剪接(alternative splicing),在真核生物中是一种非常基本的生物学事件.即基因转录后,先产生初始RNA或称作RNA前体,然后再通过可变剪接方式,选择性的把不同的外显子进行重连,从 ...

  8. 单细胞RNA测序技术之入门指南

    单细胞RNA测序技术之入门指南 [字体: 大 中 小 ] 时间:2018年09月12日 来源:生物通   编辑推荐: 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为“实验室中的家常菜”.若要 ...

  9. 单细胞转录组测序技术(scRNA-seq)及细胞分离技术分类汇总

    单细胞测序流程(http://learn.gencore.bio.nyu.edu) 在过去的十多年里,高通量测序技术被广泛应用于生物和医学的各种领域,极大促进了相关的研究和应用.其中转录组测序(RNA ...

  10. 单细胞分析实录(4): doublet检测

    最近Cell Systems杂志发表了一篇针对现有几种检测单细胞测序doublet的工具的评估文章,系统比较了常见的例如Scrublet.DoubletFinder等工具在检测准确性.计算效率等方面的 ...

随机推荐

  1. Docker环境如何配置?使用阿里云OOS一步搞定!

    背景介绍 系统运维管理OOS及扩展程序 系统运维管理OOS(CloudOps Orchestration Service)针对在阿里云ECS实例上部署应用和驱动的复杂性,特别设计了扩展程序,旨在简化用 ...

  2. itestwork(爱测试) 开源一站式接口测试&敏捷测试工作站 9.0.2Rc2发布

    (一)itest 简介 itest work (爱测试)  一站式工作站让测试变得简单.敏捷,"好用.好看,好敏捷" ,是itest wrok 追求的目标.itest work 包 ...

  3. Java求两个List集合的交集、并集、差集

    在项目中经常会求解集合的交集.并集.差集,这里做个记录.首先创建两个集合list1.list2以及添加元素. List<String> list1 = new ArrayList<& ...

  4. CSPJ赛前刷题

    T1 \(\color{red}\text{正难则反}\),最短路 T2 图论(糅杂着一点DP) T3 DP 优化:减去不需要的状态 T4 一定要写注释!!! 不开longlong见祖宗!!! T5 ...

  5. 极限科技(INFINI labs)荣获中国信通院大数据“星河”标杆案例

    12 月 6 日,由中国信息通信研究院和中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同组织的 2023 大数据"星河(Galaxy)"案例评选结果正式公示. ...

  6. 老张,你的服务是不是挂了?论全局 SLI 的重要性

    场景再现 你正在午休,正梦见中了彩票,突然收到电话告警,说服务对外接口 95 分位延迟突增,惊出一身冷汗,睡意全无,抓紧打开监控系统,查看服务的 SLI 指标,发现确实有问题,已经持续 1 分钟,这服 ...

  7. readonly和disable的区别是什么?

    Readonly和Disabled两种属性的写法如下: 1.<input type="text" name="name" value="xxx& ...

  8. NumPy 舍入小数、对数、求和和乘积运算详解

    舍入小数 在 NumPy 中,主要有五种方法来舍入小数: 截断 去除小数部分,并返回最接近零的浮点数.使用 trunc() 和 fix() 函数. 示例: import numpy as np arr ...

  9. 物理机安装Centos系统

    引言 在工作中,经常会在本地搭建开发环境,而使用的基本都是Linux系统,本文就教大家如何安装一套Centos Linux系统 准备 1.系统选择 系统:Centos 版本:7.9 2.镜像下载 下载 ...

  10. 安装nodejs易遇到的坑

    @ 目录 背景描述 流程步骤 小结 背景描述 我的服务器是centos7.9,打算先直接通过yum安装,但是yum不能指定node版本,我直接指定显示404找不到,然后我设置了下node下载的源,还是 ...