【代码更新】单细胞分析实录(21): 非负矩阵分解(NMF)的R代码实现,只需两步,啥图都有
1. 起因
之前的代码(单细胞分析实录(17): 非负矩阵分解(NMF)代码演示)没有涉及到python语法,只有4个python命令行,就跟Linux下面的ls grep一样的。然鹅,有几个小伙伴不会命令行,所以我决定再改写一下,把命令行都放到R下面运行。
2. 尝试
2.1 一开始,我的想法是教大家在R里面调用python,需要提前下载好anaconda和一些python包
然而想了想在Windows上安装python包可能对大家不是很友好,有些包很难装,我之前也弄了很久。考虑到这次更新是针对桌面版Rstudio用户,故没有采用。
2.2 最终,我采用的方案是,使用Rstudio Server,也就是网页版Rstudio
这样做有几个好处:
- 直接和云服务器连接,服务器下载python包和R包都很容易(云服务器刚买,下血本)
- 我提前配置好运行环境,用户只需上传数据,分析数据,下载数据即可。
代码方面也更加简化:
- 我尽量减少了人工处理的时间,主要分析代码只有两行
如果你之前在我这儿拿过代码,可以直接找我要更新的代码。此外,如果因为之前的代码涉及命令行,你操作起来有困难,可以找我开Rstudio Server的账户 (高端玩家就别了,服务器配置比较低,就够几个人用的那种)。
3. 注意
- 我会提前安装可能用到的R包,所以不用重复安装,直接library就可以
- 请大家及时下载结果文件,以免丢失;也请大家在做完分析后,删除表达数据,服务器存储空间不是很大
- 每个账号只保留半个月时间,若想再次使用,可以联系我再开一个账号
- 有任何问题可以微信或者邮箱问我
接下来简单介绍一下,使用方法
登录
打开我给你的链接,输入用户名和密码即可登录
之后就可以看见Rstudio的界面了
然后确保你的家目录下面有图中框出来的几个文件,并点击进入count_data
文件夹
上传数据
点击upload
上传数据
运行代码
主要是3.R
中的step1
和step2
两个函数
library(reticulate)
use_condaenv(condaenv = "cnmf_env", required = T,conda = "/home/hsy/miniconda3/bin/conda")
py_config() #如果显示cnmf_env环境里面的python就OK
source("1.R")
step1(dir_input = "count_data",dir_output = "res1",k=3:5,iteration = 50) #这里为了演示方便,取值都比较小
source("2.R")
step2(dir_input = "res1",dir_output = "res2",dir_count = "count_data",usage_filter = 0.03,top_gene = 30,cor_min = 0,cor_max = 0.6)
查看结果
step2之后,会在res2
文件夹中生成结果文件
sampleID_program.usage.norm.txt和sampleID_program.Zscore.txt
是NMF分解表达矩阵得到的两个矩阵
program_topngene.txt
这是所有program的前几十个基因,一般会放到文件附表
program_pearson_cor.complete.heatmap.pdf
program之间的相关性热图
cor_heatmap_data.txt
用来画上图的数据
program_topngene_enrichment.xlsx
program_topngene_enrichment_order.csv
这两个都是对program前几十个基因的富集分析结果,这两个文件可以用来辅助我们理解program,其中第二个文件和相关性热图的顺序一致,看起来更方便
sampleID_program_gene.heatmap.pdf
用来验证在这个样本中,program找得对不对,其实就是看program的表达,一般看program的前几十个基因
sampleID_data_heatmap.txt
用来画上面那个热图的数据
program之间的相关性热图
某个样本中program的表达
下载结果
选中你想导出的文件,点击more
,再点击Export
就可以了
至此,公众号仅有的两篇付费教程都已更新完毕~
因水平有限,有错误的地方,欢迎批评指正!
【代码更新】单细胞分析实录(21): 非负矩阵分解(NMF)的R代码实现,只需两步,啥图都有的更多相关文章
- 单细胞分析实录(17): 非负矩阵分解(NMF)代码演示
本次演示使用的数据来自2017年发表于Cell的头颈鳞癌单细胞文章:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumo ...
- 【代码更新】单细胞分析实录(20): 将多个样本的CNV定位到染色体臂,并画热图
之前写过三篇和CNV相关的帖子,如果你做肿瘤单细胞转录组,大概率看过: 单细胞分析实录(11): inferCNV的基本用法 单细胞分析实录(12): 如何推断肿瘤细胞 单细胞分析实录(13): in ...
- 非负矩阵分解NMF
http://blog.csdn.net/pipisorry/article/details/52098864 非负矩阵分解(NMF,Non-negative matrix factorization ...
- 文本主题模型之非负矩阵分解(NMF)
在文本主题模型之潜在语义索引(LSI)中,我们讲到LSI主题模型使用了奇异值分解,面临着高维度计算量太大的问题.这里我们就介绍另一种基于矩阵分解的主题模型:非负矩阵分解(NMF),它同样使用了矩阵分解 ...
- 漂浮广告代码兼容ie、firefox,多个漂浮不冲突,调用只需两行代码
原文:漂浮广告代码兼容ie.firefox,多个漂浮不冲突,调用只需两行代码 将广告内容放在div中,设置一个id,然后用下面方法调用var adcls=new AdMove("div的id ...
- 如何把C++的源代码改写成C代码?而C改C++只需一步!
★ 如何把C++的源代码改写成C代码? C++解释器比C语言解释器占用的存储空间要大,想要在某些特定场合兼容C++代码,同时为了节省有限的存储空间,降低成本,也为了提高效率,将用C++语言写的源程序用 ...
- 单细胞分析实录(5): Seurat标准流程
前面我们已经学习了单细胞转录组分析的:使用Cell Ranger得到表达矩阵和doublet检测,今天我们开始Seurat标准流程的学习.这一部分的内容,网上有很多帖子,基本上都是把Seurat官网P ...
- 单细胞分析实录(3): Cell Hashing数据拆分
在之前的文章里,我主要讲了如下两个内容:(1) 认识Cell Hashing:(2): 使用Cell Ranger得到表达矩阵.相信大家已经知道了cell hashing与普通10X转录组的差异,以及 ...
- 单细胞分析实录(2): 使用Cell Ranger得到表达矩阵
Cell Ranger是一个"傻瓜"软件,你只需提供原始的fastq文件,它就会返回feature-barcode表达矩阵.为啥不说是gene-cell,举个例子,cell has ...
随机推荐
- 一文彻底掌握Apache Hudi异步Clustering部署
1. 摘要 在之前的一篇博客中,我们介绍了Clustering(聚簇)的表服务来重新组织数据来提供更好的查询性能,而不用降低摄取速度,并且我们已经知道如何部署同步Clustering,本篇博客中,我们 ...
- ARC122C-Calculator【乱搞,构造】
正题 题目链接:https://atcoder.jp/contests/arc122/tasks/arc122_c 题目大意 一个数对开始是\((0,0)\),每次可以选择一个数加一或者让一个数加上另 ...
- hdu5909-Tree Cutting【FWT】
正题 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5909 题目大意 给出\(n\)和\(m\)(\(m=2^k\)).再给出一个大小为\(n\)的树 ...
- 01 ASP.NET Core 3 启动过程(一)
ASP.NET Core 3 启动过程(一) 最近又忙于各种扯淡,今天来一个需求,明天又来一个需求,后天需求又变了,这可能是很多人遇到的情况.正在紧张的忙碌着,突然一个信息把所有计划打乱了," ...
- 被校园网限速限流的日子 | 路由代理ipv6访问的操作手册
一 前 言 你是否还在为校园网的收费而小心翼翼?你是否还在为网速不够快而影响科研进程? 你是否还在为处理舍友关系而费经心思? 你是否还在为不能给舍友提供价值而苦恼? 那么,叶子团队或许能够帮助到你解决 ...
- OpenStack创建Win10实例
直接用Windows的iso文件创建实例是创建不出来的,需要先在kvm下创建qcow2格式的虚拟机,然后用已经创建好的虚拟机文件当做OpenStack的镜像来创建实例就好了. 首先第一点是需要有一台L ...
- Windows10通过WSL编译jdk12
Windows使用WSL编译OpenJDK 安装Ubuntu以及配置国内镜像 首选确保windows10已经安装了ubuntu 更换ubuntu20.04国内镜像,这里我选择的是阿里云镜像 sudo ...
- C#开发BIMFACE系列42 服务端API之图纸对比
BIMFACE二次开发系列目录 [已更新最新开发文章,点击查看详细] 在我的前一篇博客<C#开发BIMFACE系列42 服务端API之图纸对比>中详细介绍了BIMFACE服务端接口 ...
- 题解 [ZJOI2019]语言
题目传送门 题目大意 给出一个 \(n\) 个点的树,现在有 \(m\) 次操作,每次可以选择一个链 \(s,t\),,然后这条链上每个点都会增加一个相同属性,问对于每一个点有与它相同属性的有多少个点 ...
- 数据库DDL与DML对应含义
DDL:指的是操作数据库.表.字段的相关语句,例如:create.alter.drop DML:指的是对表中的数据进行增删改的操作,例如:insert.update.delete 查询语句书写顺序:s ...