Spanve:一种检测大规模空间转录组学数据中空间变异基因的有效统计方法
文章题目
Spanve: an Effective Statistical Method to Detect Spatially Variable Genes in Large-scale Spatial Transcriptomics Data
中文名:
Spanve:一种检测大规模空间转录组学数据中空间变异基因的有效统计方法
文章地址:
https://doi.org/10.1101/2023.02.08.527623
本文主旨
提出了Spanve(空间邻域可变表达基因),这是一种基于统计的方法,用于从空间转录组学数据中检测空间依赖性表达基因,通过将空间和表达的依赖性建模为两个分布的距离,该方法具有较高的计算效率和准确性。Spanve能够输入空间转录组并改进空间组织区域的识别。
出发点
作者认为 判断空间转录组学数据的空间模式,需要找到 HVG 高可变基因 或者说 找到SV spatially variable gene 。因为SV基因可由细胞类型定位或空间依赖性细胞相互作用引起,因此可用于多个下游分析,例如重建组织结构。SV基因也有助于提供生物学见解,因为不同的空间表达模式反映了不同的基因功能。
目前的找到sv的方法 取决于 使用协方差矩阵或者说使用聚类方法 他们都不适用于大规模数据集。
此外,基因表达建模技术经常依赖于高斯分布或泊松分布,这可能导致较高的假阳性率,因为并非所有基因表达都符合这些假设。
Spanve这个方法考虑到了 上述所说的问题 不考虑将细胞内的表达建模为传统的统计类分布(经典的几种分布)而转换使用细胞与空间邻居之间的差异性。
由于可能存在位置效应,包括细胞类型分布、局部环境和细胞相互作用,简单分布可能无法描述基因表达,而复杂分布则大大增加了参数的数量和拟合时间。没有基因表达分布的假设,Spanve能够准确地识别具有空间表达模式的基因
此外,通过考虑细胞与空间之间的作用,spanve可以感知空间domain
此外 ,还采用了空间插补方法。

评价指标
使用Moran's I指数:

https://www.jianshu.com/p/305c608f2884?ivk_sa=1024320u
使用Geary's C指数:
这个其实和上面的莫兰指数差不多:

二者区别和联系

moran 和 geary本身都代表空间自相关性
Spanve在 Moran 和 Geary上的效果都是最好的:

CH index
CH指数越高,SV基因作为特征的数据越有可能获得基于原始数据的聚类标记,这意味着SV基因更能代表原始数据。

结果

插补的引入
SPANGE同时引入了插补的概念!这个用于检测生成差异表达基因(SV)的工具同时可以用于插补 插补的方法如下

结果说明

插补后数据的AMI和ARI有着显著的提升

Spanve插补后聚类有了很大改善,可以获得更清晰的组织层边界
总结
Spanve作为一种新开发的空间可变基因(SV)识别方法,该方法可提供可缩放的集群感知基因。本文作者估计,随着空间转录组学数据规模的扩大,可扩展性将变得更加重要。与当前方法相比,Spanve在大规模空间转录组学数据中需要最少的时间和计算成本。此外,Spanve鉴定的基因在空间上更加异质,有利于进一步聚类。Spanve作者团队同时还创建了一种空间插补方法,该方法允许使用流行的聚类方法来识别更准确的组织结构。
限制和不足
一个限制是它不能同时处理来自类似组织切片的数据,以检测稳健的SV基因并利用先前的数据。
Spanve:一种检测大规模空间转录组学数据中空间变异基因的有效统计方法的更多相关文章
- ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...
- Nature Methods | 新软件SAVER-X可对单细胞转录组学数据进行有效降噪
图片来源(Nature Methods) 摘要 单细胞转 ...
- 4种检测是否支持HTML5的方法,你知道几个?
4种检测是否支持HTML5的方法,你知道几个? 1,检查特定的属性是否存在于全局的对象里面,比如说window或navigator. 比如geolocation,它是HTML5新加支持的新特性:它是由 ...
- Spring MVC内置支持的4种内容协商方式【享学Spring MVC】
每篇一句 十个光头九个富,最后一个会砍树 前言 不知你在使用Spring Boot时是否对这样一个现象"诧异"过:同一个接口(同一个URL)在接口报错情况下,若你用rest访问,它 ...
- 关于ubuntu系统boot分区空间不足而又无法卸载旧内核的解决方法
2016年09月03日 14:16:45 萧氏一郎 阅读数:7802 标签: ubuntuboot分区清理更多 个人分类: linux 版权声明:本文为本猿原创文章,转载务必注明出处,多谢. ht ...
- Oracle创建删除用户,角色,表空间,导入导出数据库命令总结(转载)
无意间看到一篇文章,觉得对于ORACLE的新手很实用,特转载,原文出处这里 说明:在创建数据库时输入的密码,是修改系统默认的密码,以system和sysman等系统默认身份登录时要输入的密码就是修改后 ...
- 表空间tablespace,数据文件datafiles,和控制文件control files介绍
https://docs.oracle.com/cd/B19306_01/server.102/b14220/physical.htm#i5919 本文系翻译 表空间tablespace,数据文件da ...
- [20170623]利用传输表空间恢复部分数据.txt
[20170623]利用传输表空间恢复部分数据.txt --//昨天我测试使用传输表空间+dblink,上午补充测试发现表空间设置只读才能执行impdp导入原数据,这个也很好理解.--//这样的操作模 ...
- 5 种使用 Python 代码轻松实现数据可视化的方法
数据可视化是数据科学家工作中的重要组成部分.在项目的早期阶段,你通常会进行探索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些理解.创建可视化方法确实有助于使 ...
- EXPDP/IMPDP与EXP/IMP在不同用户和表空间之间迁移数据的实现方法
1. EXPDP/IMPDP方式 SQL> create user zlm identified by zlm; User created. SQL> grant connect,reso ...
随机推荐
- python 小球碰撞游戏
#小球和挡板要自己找照片,放在一个单独文件夹,音乐也是一样的import pygame pygame.init()#游戏资源加载 a = 700#x轴为700 b = 800#y抽为800 sceee ...
- JavaScript:函数:函数的参数
声明函数的时候,有个括号,这里面可以加上函数的参数,这些参数,我们叫做形参(形式参数): 此时这些参数,也是已经声明了的变量,只是还没有赋值而已. 也可以不加,取决于函数的逻辑.如果函数需要从外部传进 ...
- WCF 服务容器化的一些问题
背景 目前项目当中存有 .NET Framework 和 .NET Core 两种类型的项目,但是都需要进行容器化将其分别部署在 Windows 集群和 Linux 集群当中.在 WCF 进行容器化的 ...
- [OpenCV实战]1 基于深度学习识别人脸性别和年龄
目录 1基于CNN的性别分类建模原理 1.1 人脸识别 1.2 性别预测 1.3 年龄预测 1.4 结果 2 代码 参考 本教程中,我们将讨论应用于面部的深层学习的有趣应用.我们将估计年龄,并从单个图 ...
- Python从0到1丨细说图像增强及运算
摘要:本文主要讲解常见的图像锐化和边缘检测方法,即Roberts算子和Prewitt算子. 本文分享自华为云社区<[Python从零到壹] 五十七.图像增强及运算篇之图像锐化Roberts.Pr ...
- .NET6使用NLog向文件、数据库写数据
1.Nuget 引入 NLog NLog.Web.AspNetCore NLog.Database(写入数据库使用) 2.创建nlog.config 注意数据库连接字符串需要配置TrustServer ...
- ArcGIS工具 - 导出空数据库
有时,需要根据已有的成果数据创建一个空的数据库模板文件,用于新的编辑或对外发布.那么,如果又快又好的创建呢?为源GIS为您编写了一个导出空数据库工具,它可以实现"一键"快速导出任意 ...
- [cocos2d-x]从源码角度思考convertToWorldSpace()与convertToWorldSpaceAR()坐标系的转换
convertToWorldSpace() 话不多说,先上源码,之后再慢慢讲解: (5和6图截图的时候重复了,这里就不弄出来了) 只要通过图1到图8中我写的注释进行分析(不懂的地方可以自己去翻一下co ...
- Zabbix与乐维监控对比分析(八)——其他功能篇
前面我们详细介绍了Zabbix与乐维监控的架构与性能.Agent管理.自动发现.权限管理.对象管理.告警管理.可视化.图形图表及网络功能方面的对比分析,接下来我们将对二者其他功能进行对比分析. 本篇是 ...
- 联邦学习(Federated Learning)
联邦学习的思想概括为:一种无需交换数据(只交换训练中间参数或结果)的分布式机器学习技术,在保护数据隐私的同时实现数据共享,解决数据孤岛问题. 本文仅介绍基本概念,详细请查看文末参考资料. 基本概念 联 ...