R画网络图
R 画网络图
目的:用R做生信分析,画基因样本的网络图,从中观察样本的致病性情况。
一、所用到的包
- library(tidyr)
- library(ggplot2)
- library(reshape2)
- library(readr)
- library(network)
- library(dplyr)
- library(plyr)
- library(sna)
- library(GGally)
- library(ggnetwork)
- library(tidygraph)# tidy graph analysis
- #library(tidyverse)# tidy data analysis
- library(ggraph)
- library(stringr)
- library(networkD3)
- library(igraph)
- library(visNetwork)
- library(threejs)
- library(ndtv)
- library(grid)
- library(Rmisc)
- #library(vioplot)
- library(tibble)
13行中:tidyverse包集成了很多画图的包:如下
tidyverse_packages(include_self = TRUE)
[1] "broom" "cli" "crayon" "dplyr" "dbplyr" "forcats" "ggplot2" "haven" "hms" "httr"
[11] "jsonlite" "lubridate" "magrittr" "modelr" "purrr" "readr" "readxl\n(>=" "reprex" "rlang" "rstudioapi"
[21] "rvest" "stringr" "tibble" "tidyr" "xml2" "tidyverse"
但是如果同时使用这些包,会提示tidyverse_conflicts(),使用tidyverse_conflicts()可以查看tidyverse和其他哪些包冲突:
> tidyverse_conflicts()
-- Conflicts ------------------------------------------ tidyverse_conflicts() --
x tidygraph::arrange() masks dplyr::arrange(), plyr::arrange()
x tibble::as_data_frame() masks igraph::as_data_frame(), dplyr::as_data_frame()
x purrr::compact() masks plyr::compact()
x purrr::compose() masks igraph::compose()
x dplyr::count() masks plyr::count()
x tidyr::crossing() masks igraph::crossing()
x dplyr::failwith() masks plyr::failwith()
x tidygraph::filter() masks dplyr::filter(), stats::filter()
x igraph::groups() masks tidygraph::groups(), dplyr::groups()
x dplyr::id() masks plyr::id()
x dplyr::lag() masks stats::lag()
x tidygraph::mutate() masks dplyr::mutate(), plyr::mutate()
x tidygraph::rename() masks dplyr::rename(), plyr::rename()
x purrr::simplify() masks igraph::simplify()
x dplyr::summarise() masks plyr::summarise()
x dplyr::summarize() masks plyr::summarize()
所以我注释掉了tidyverse,需要用哪个包就自己添加。
二、画网络图遇到的问题
1.颜色自定义
我根据list中属性的种类来定义nodes的颜色,de[,5]中的值为“P”、“V”、“B”,三个类别。
常规的写法是:
geom_node_point(size = 3, alpha = 1,aes(color =de[,5])),
这样系统自动分陪颜色,红绿蓝给BPV,
但是会出现以下问题:
A) de[,5]中PVB 出现的顺序会影响到颜色的标记。
B) de[,5]中PVB并不是三种都出现,而是三种的随机组合出现,比如只有PV或者只有VB或者只有PB。
以上原因导致网络图中颜色不对应,第一幅图中红=B 绿=P 蓝=V,如果de[,5]中只有BV两种,会生成红=B,绿=V,导致图例和实际的PVB值不对应。
同时因为看的人肯能出现色盲的情况,一般不用红色和绿色来表示nodes的颜色,所以需要自定义颜色。
比如我需要自定义颜色:效果是这样
'V'='#b27390', 'P'='#f15941','B'='#42a3c6'
我用的ggraph这个画图函数,所以只需要加上scale_color_manual就行:
(如果使用的是ggplot,则用scale_fill_manual)。
这里需要注意scale_color_manua有两种写法:
1)scale_color_manual(name="diagnosis",labs=c(‘V’,’P’,’B’) values=c(''#b27390', '#f15941','#42a3c6'))
2)scale_color_manual(name="diagnosis", values=c('V'='#b27390', 'P'='#f15941','B'='#42a3c6'))
必选参数values:https://blog.csdn.net/songzhilian22/article/details/49388973
values,用于指定这个标度应该生成的值。如果这个向量中的元素是有名称的。则它将自动匹配输入和输出的值,否则它将按照离散型变量中水平的先后次序进行匹配。所以选择第2中方法给定义颜色,以免随机产生颜色。
最后的结果如下:
2.多样本for循环的使用问题
本数据中包含多个样本,在画图之前要对样本进行切割,使用split最好不过了。
split(data1, as.factor(data1$gene))#按照基因切割
split(gene, gene$sampleid)#按照样本切割
切割后添加过滤条件,一个样本至少携带两个variant的sample保留下来做网络图。行数≥2的说明只有两个variant,按照gene切割的安装代码如下,用到第一个for循环:
for (gene in data_per_gene) {
data_per_sample_per_gene <- split(gene, gene$sampleid)
########### Then we enumerate each sample to obtain the edges ###############
for (sample in data_per_sample_per_gene) {
######### we demand sample carry >=2 variants in the same gene to be considered #############
if ((nrow(sample)>=2)&&(sum(sample$GT)==2)){
####### create combinations of variants #################################
a <- combn(sample$num_id,2)
b <- data.frame(t(a))
b$sample <- as.character(unique(sample$sampleid))
b$gene <- as.character(unique(sample$gene))
edge <- rbind(edge, b)
}
}
}
然后对edge中的边所对应的gene切割
edge_per_gene <- split(edge, as.factor(edge$gene))
接下来我们为每个基因的每一个variant创建边:用到第二个for循环
for (gene in edge_per_gene)
这个循环里,我们不仅要完成边和点的连接,还要完成画图。
3.连接边和点
对edge中的X1,X2进行分组操作,然后计算边的权重。(不同的样本有相同的边也合并计算权重,值保留一条边,用权重weight表示边连接的次数)
edge2 <- gene %>%
group_by(X1, X2) %>%
summarise(weight = n()) %>%
ungroup()
unique(edge2)
然后定义nodes,选择X1和X2中唯一出现的num_id合并去重,
nodesX1 <- subset(nodes0, (nodes0$num_id %in%edge2$X1))
nodesX2 <- subset(nodes0, (nodes0$num_id %in%edge2$X2))
nodes2<-unique(rbind(nodesX1,nodesX2))
把nodes2的第一列单独拿出来:
nodes3<-as.data.frame(nodes2[,1])
接下来建立点和边的连接关系,我们把nodes3 重新编号命名,
nodes3$ID <- seq(1:nrow(nodes3))
colnames(nodes3) <- c("var","id")
nodes3$var <- as.integer(nodes3$var)
edges2中的边也通过id与nodes3建立连接:
edges <- edge2 %>%
left_join(nodes3, by = c(X1 = "var")) %>%
rename(from = id)
edges <- edges %>%
left_join(nodes3, by = c(X2 = "var")) %>%
rename(to = id)
最后,选择边的集合:
edges <- select(edges, from,to,weight)
4.画网络图
我们创建无向图,directed = FALSE。
我使用的library(network),网上还有library(networkD3),library(sna)等。
routes_network <- network(edges,
vertex.attr = nodes3,
matrix.type = "edgelist",
ignore.eval = FALSE)
routes_tidy <- tbl_graph(nodes = nodes3, edges = edges, directed = FALSE)
5.ggraph画图
画图之前,我们自定义点的名字nodename
de<- routes_tidy %>%
activate(nodes) %>%
as.data.frame()
de<-cbind(de,nodes2$color_net)
colnames(de) <- c("var","id","degree","centrality","diagnosis")
nodename<-paste(de$degree,"-",de$var)
最后使用ggraph画图:
ggraph(routes_tidy ,layout = "fr") +
geom_edge_link(aes(width = weight),alpha = 0.6) +
geom_node_point(size = 3, alpha = 1,aes(color =de[,5])) +
scale_color_manual(name="diagnosis", values=c('V'='#b27390', 'P'='#f15941','B'='#42a3c6'))+#分配颜色
geom_node_text(aes(label = nodename), size = 0.5, repel = FALSE) +
scale_edge_width(range = c(0.2, 2)) +
labs(x = "", y = "", title = filename) +
theme(axis.ticks = element_blank()) +
theme(axis.text.x = element_blank())+
theme(axis.text.y = element_blank())+
theme(panel.grid=element_blank())+
theme(panel.background=element_blank())+
theme(panel.border=element_blank())
5.计算nodes的相关属性
中心度:点度频率(每种点度数的个数/所有点个数)
routes_tidy <-routes_tidy %>%
activate(nodes) %>%
mutate(centrality = degree(routes_tidy)/vcount(routes_tidy))
度:degree
#nodes的度
routes_tidy <-routes_tidy %>%
activate(nodes) %>%
mutate(degree = centrality_degree())
R画网络图的更多相关文章
- 使用R画地图数据
用R画地图数据 首先,从这里下载中国地图的GIS数据,这是一个压缩包,完全解压后包含三个文件(bou2_4p.dbf.bou2_4p.shp和bou2_4p.shx),将这三个文件解压到同一个目录下. ...
- 用 R 画中国分省市地图
用 R 画中国分省市地图 (2010-11-18 16:25:34) 转载▼ 标签: 中国地图 营销 杂谈 分类: 数据分析 用R 也可以做出漂亮的依参数变化的中国地图. 主要参考(http://co ...
- 用R画韦恩图
#导入R包 library(grid)library(futile.logger)library(VennDiagram) #建立测试数据集 A = 1:150B = c(121:170,300:32 ...
- 用R画有图例的中国地图
近期在网上找了几种画中国地图方法,终于认为这种方法还是最适用的 1.用googlevis包.因为中国国情如今已经不能訪问google地图了.所以大多中国用户来说仅仅能望洋兴叹了. 2.用ggplot包 ...
- R 画地图
R 绘制中国省市分布地图 library(maps) library(mapdata) library(maptools); getColor=function(mapdata,provname,pr ...
- R画散点图、线型图、箱型图、直方图基本知识
1.导入数据 2.散点图 plot(iris[,1]~iris[,4],xlab='Length',ylab='Width',col='red',main='Length VS Width')
- R 画structure图
id percent k1_B04_WL-1.fs_1 0.021 k31_B04_WL-1.fs_1 0.624 k21_B04_WL-1.fs_1 0.355 k1 K=3 数据输 ...
- r画饼图
原始图样: library(ggplot2) dt = data.frame(A = c(2, 7, 4, 10, 1), B = c('B','A','C','D','E')) p = ggplot ...
- R画柱形图和箱线图
数据格式如下 gene_id Sham-1 Sham-2 Sham-3 Sham-4 Sham-5 Rep-1h-1 Rep-1h-2 Rep-1h-3 Rep-1h-4 Rep-1h-5 Rep-3 ...
随机推荐
- Mahout 模糊kmeans
Mahout 模糊KMeans 一.算法流程 模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法.1973 年,Bezdek 提 ...
- Xcode中的调试工具栏简介
如下图所示: 从左至右,第一个按钮用来隐藏调试区域. 第二个按钮向你展示断点是否被全局开启或禁用.如果它不是高亮蓝色,则没有断点会被触发. 第三个按钮暂停或继续程序的执行,你一般点击它继续运行到程序的 ...
- 漫谈程序员(十八)windows中的命令subst
漫谈程序员(十八)windows中的命令subst 用法格式 一.subst [盘符] [路径] 将指定的路径替代盘符,该路径将作为驱动器使用 二.subst /d 解除替代 三.不加任何参数键入 ...
- Android应用---基于NDK的samples例程hello-jni学习NDK开发
Android应用---基于NDK的samples例程hello-jni学习NDK开发 NDK下载地址:http://developer.android.com/tools/sdk/ndk/index ...
- Android虚拟机 USB转串口调试方法
有时候需要在虚拟机调试串口,首先安装串口的驱动程序(不知道的话可以用驱动精灵),然后打开设备管理器找到驱动,查看驱动使用的端口(比如COM3),虚拟机需要在命令行启动: 将SDK下的tools文件夹加 ...
- 《java入门第一季》之面向对象面试题(代码块一网打尽)
<pre name="code" class="java">/* 代码块:在Java中,使用{}括起来的代码被称为代码块. 根据其位置和声明的不同, ...
- Java进阶(十三)servlet监听器
servlet监听器 Listener是Servlet的监听器,它可以监听客户端的请求.服务端的操作等.通过监听器,可以自动激发一些操作,比如监听在线的用户的数量.当 增加一个HttpSession时 ...
- 添加启动游戏过渡场景Default Splash Scene(Unity3D开发之十三)
添加启动游戏过渡场景Default Splash Scene(Unity3D开发之十三) 猴子原创,欢迎转载.转载请注明: 转载自Cocos2Der-CSDN,谢谢! 原文地址: http://blo ...
- workbench的schema讲解一:(维度dimension设置的基本内容)
维度名字尽量用英文:因为,saiku读取schema配置文件时,用中文会出现不可预知的错误.比如,引用维度用中文,就容易出现不可预估的错误.如果要显示中文:每个对象的caption字段里键入中文,则可 ...
- adb shell后出现error解决方案
解决办法: 解决办法: 1.adb kill-server 2.adb start-server 3.adb remount 4.adb shell 一般情况下都可以在此启动adb相关