1. 起因

之前的代码(单细胞分析实录(17): 非负矩阵分解(NMF)代码演示)没有涉及到python语法,只有4个python命令行,就跟Linux下面的ls grep一样的。然鹅,有几个小伙伴不会命令行,所以我决定再改写一下,把命令行都放到R下面运行。

2. 尝试

2.1 一开始,我的想法是教大家在R里面调用python,需要提前下载好anaconda和一些python包

然而想了想在Windows上安装python包可能对大家不是很友好,有些包很难装,我之前也弄了很久。考虑到这次更新是针对桌面版Rstudio用户,故没有采用。

2.2 最终,我采用的方案是,使用Rstudio Server,也就是网页版Rstudio

这样做有几个好处:

  • 直接和云服务器连接,服务器下载python包和R包都很容易(云服务器刚买,下血本)
  • 我提前配置好运行环境,用户只需上传数据,分析数据,下载数据即可。

代码方面也更加简化:

  • 我尽量减少了人工处理的时间,主要分析代码只有两行

如果你之前在我这儿拿过代码,可以直接找我要更新的代码。此外,如果因为之前的代码涉及命令行,你操作起来有困难,可以找我开Rstudio Server的账户 (高端玩家就别了,服务器配置比较低,就够几个人用的那种)。

3. 注意
  • 我会提前安装可能用到的R包,所以不用重复安装,直接library就可以
  • 请大家及时下载结果文件,以免丢失;也请大家在做完分析后,删除表达数据,服务器存储空间不是很大
  • 每个账号只保留半个月时间,若想再次使用,可以联系我再开一个账号
  • 有任何问题可以微信或者邮箱问我

接下来简单介绍一下,使用方法


登录

打开我给你的链接,输入用户名和密码即可登录

之后就可以看见Rstudio的界面了

然后确保你的家目录下面有图中框出来的几个文件,并点击进入count_data文件夹

上传数据

点击upload上传数据

运行代码

主要是3.R中的step1step2两个函数

library(reticulate)

use_condaenv(condaenv = "cnmf_env", required = T,conda = "/home/hsy/miniconda3/bin/conda")
py_config() #如果显示cnmf_env环境里面的python就OK source("1.R")
step1(dir_input = "count_data",dir_output = "res1",k=3:5,iteration = 50) #这里为了演示方便,取值都比较小 source("2.R")
step2(dir_input = "res1",dir_output = "res2",dir_count = "count_data",usage_filter = 0.03,top_gene = 30,cor_min = 0,cor_max = 0.6)

查看结果

step2之后,会在res2文件夹中生成结果文件

sampleID_program.usage.norm.txt和sampleID_program.Zscore.txt
是NMF分解表达矩阵得到的两个矩阵 program_topngene.txt
这是所有program的前几十个基因,一般会放到文件附表 program_pearson_cor.complete.heatmap.pdf
program之间的相关性热图
cor_heatmap_data.txt
用来画上图的数据 program_topngene_enrichment.xlsx
program_topngene_enrichment_order.csv
这两个都是对program前几十个基因的富集分析结果,这两个文件可以用来辅助我们理解program,其中第二个文件和相关性热图的顺序一致,看起来更方便 sampleID_program_gene.heatmap.pdf
用来验证在这个样本中,program找得对不对,其实就是看program的表达,一般看program的前几十个基因
sampleID_data_heatmap.txt
用来画上面那个热图的数据

program之间的相关性热图

某个样本中program的表达

下载结果

选中你想导出的文件,点击more,再点击Export就可以了


至此,公众号仅有的两篇付费教程都已更新完毕~

因水平有限,有错误的地方,欢迎批评指正!

【代码更新】单细胞分析实录(21): 非负矩阵分解(NMF)的R代码实现,只需两步,啥图都有的更多相关文章

  1. 单细胞分析实录(17): 非负矩阵分解(NMF)代码演示

    本次演示使用的数据来自2017年发表于Cell的头颈鳞癌单细胞文章:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumo ...

  2. 【代码更新】单细胞分析实录(20): 将多个样本的CNV定位到染色体臂,并画热图

    之前写过三篇和CNV相关的帖子,如果你做肿瘤单细胞转录组,大概率看过: 单细胞分析实录(11): inferCNV的基本用法 单细胞分析实录(12): 如何推断肿瘤细胞 单细胞分析实录(13): in ...

  3. 非负矩阵分解NMF

    http://blog.csdn.net/pipisorry/article/details/52098864 非负矩阵分解(NMF,Non-negative matrix factorization ...

  4. 文本主题模型之非负矩阵分解(NMF)

    在文本主题模型之潜在语义索引(LSI)中,我们讲到LSI主题模型使用了奇异值分解,面临着高维度计算量太大的问题.这里我们就介绍另一种基于矩阵分解的主题模型:非负矩阵分解(NMF),它同样使用了矩阵分解 ...

  5. 漂浮广告代码兼容ie、firefox,多个漂浮不冲突,调用只需两行代码

    原文:漂浮广告代码兼容ie.firefox,多个漂浮不冲突,调用只需两行代码 将广告内容放在div中,设置一个id,然后用下面方法调用var adcls=new AdMove("div的id ...

  6. 如何把C++的源代码改写成C代码?而C改C++只需一步!

    ★ 如何把C++的源代码改写成C代码? C++解释器比C语言解释器占用的存储空间要大,想要在某些特定场合兼容C++代码,同时为了节省有限的存储空间,降低成本,也为了提高效率,将用C++语言写的源程序用 ...

  7. 单细胞分析实录(5): Seurat标准流程

    前面我们已经学习了单细胞转录组分析的:使用Cell Ranger得到表达矩阵和doublet检测,今天我们开始Seurat标准流程的学习.这一部分的内容,网上有很多帖子,基本上都是把Seurat官网P ...

  8. 单细胞分析实录(3): Cell Hashing数据拆分

    在之前的文章里,我主要讲了如下两个内容:(1) 认识Cell Hashing:(2): 使用Cell Ranger得到表达矩阵.相信大家已经知道了cell hashing与普通10X转录组的差异,以及 ...

  9. 单细胞分析实录(2): 使用Cell Ranger得到表达矩阵

    Cell Ranger是一个"傻瓜"软件,你只需提供原始的fastq文件,它就会返回feature-barcode表达矩阵.为啥不说是gene-cell,举个例子,cell has ...

随机推荐

  1. 鸿蒙内核源码分析(异常接管篇) | 社会很单纯 , 复杂的是人 | 百篇博客分析OpenHarmony源码 | v39.03

    百篇博客系列篇.本篇为: v39.xx 鸿蒙内核源码分析(异常接管篇) | 社会很单纯,复杂的是人 | 51.c.h .o 硬件架构相关篇为: v22.xx 鸿蒙内核源码分析(汇编基础篇) | CPU ...

  2. Ubuntu开发相关环境搭建

    一.Ubuntu系统语言环境切换修改 安装时,选择的中文版,但实际使用起来,很不爽,果断切换为英文 1.1 打开终端: vim /etc/default/locale 1.2 修改配置 LANG=&q ...

  3. farOs 介绍

    nGame nGame 一款文字游戏服务端框架;用于快速构建:自由探索.武侠.修真.模拟,回合制,剧本杀.动态语言小说.等服务器 如果你有期望实现的功能请加Q群 ngame计划 完善框架功能 farO ...

  4. 势流理论笔记:03 Hess-Smith积分方法

    书接上回势流理论笔记:02 直接法与间接法 Hess-Smith方法 采用面向对象编程的思路,\(Matlab\)程序脚本,实现以下功能: 输入面元(四边形面元顶点坐标) 输出系数矩阵\([H][M] ...

  5. Redis的一些常用命令

    查看所有键 keys * 首先先向数据库中插入一些键值对 演示keys *命令 keys *查询所有键的方式是遍历数据库中的键,其时间复杂度为O(n),如果数据库的数量一旦过大,其效率就大大降低,因此 ...

  6. CentOS7下Hadoop伪分布式环境搭建

    CentOS7下Hadoop伪分布式环境搭建 前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...

  7. 创业公司用 Serverless,到底香不香?

    作者 | Mike Butusov 来源 | Serverless 公众号 在过去的 5 年里,使用云厂商处理应用后台的流行程度大幅飙升.其一,初创企业主采用 Serverless 方式,以节省基础设 ...

  8. The Data Way Vol.3|做到最后只能删库跑路?DBA 能做的还有很多

    关于「The Data Way」 「The Data Way」是由 SphereEx 公司出品的一档播客节目.这里有开源.数据.技术的故事,同时我们关注开发者的工作日常,也讨论开发者的生活日常:我们聚 ...

  9. 定制input元素

    定制input元素 input元素可以用来生成一个供用户输入数据的简单文本框.其缺点在于用户在其中输入什么值都可以.有时这还不错,但是有时设计者可能希望让用户输入特定类型的数据.在后一种情况下,可以对 ...

  10. mysql group by语句流程是怎么样的

    group by流程是怎么样的 注意点: select id%10 as m, count(*) as c from t1 group by m; group by是用于对数据进行分组,我们排序用到了 ...