(数据科学学习手札55)利用ggthemr来美化ggplot2图像
一、简介
R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原生ggplot2图像进行美化,掌握它之后你就可以创作出更具特色和美感的数据可视化作品。
二、基础内容
2.1 安装
不同于常规的R包,ggthemr并没有在CRAN上发布,因此我们需要使用devtools中的install_github()直接从github上安装它,参照github上ggthemr的项目说明页:
library(devtools) install_github('cttobin/ggthemr')
笔者在遵循上述步骤时不太顺利,遇到了如下错误:
不过不用担心,按照上述的错误提示,我们打开对应目录,找到了对应的压缩包:
实际上我们通过上述语句已经将ggthemr的压缩包下载到本地如上图所示,所以我们可以很容易地使用手动安装本地压缩包的形式来完成ggthemr的安装(注意要吧.tar格式改为.tar.gz格式,我想这可能是install_github()安装失败的原因):
经过上述步骤我们便完成了ggthemr的安装准备工作;
2.2 傻瓜式用法
在我之前写得某篇文章中使用过Python中matplotlib.pyplot.style,仅仅使用style.use()这个语句,便可傻瓜式地载入各种精美的自适应绘图主题,在ggthemr中也有类似的功能,我们在利用ggplot2创建图像的语句之前,加上ggthemr('主题名称'),便可简单套用多种内建主题,下面是几个简单的例子:
rm(list=ls())
library(ggplot2)
library(ggthemr) data(mpg)
data <- mpg #chalk风格
ggthemr('chalk')
p1 <- ggplot(data=data, aes(displ, hwy))+
geom_point(mapping = aes(shape=factor(cyl)))+
geom_smooth(mapping = aes(displ,hwy,colour=factor(cyl)))
print(p1)
#dust风格
ggthemr('dust')
p2 <- ggplot(data=data, aes(displ, hwy))+
geom_point(mapping = aes(shape=factor(cyl)))+
geom_smooth(mapping = aes(displ,hwy,colour=factor(cyl)))
print(p2)
#flat风格
ggthemr('flat')
p3 <- ggplot(data=data, aes(displ, hwy))+
geom_point(mapping = aes(shape=factor(cyl)))+
geom_smooth(mapping = aes(displ,hwy,colour=factor(cyl)))
print(p3)
而官方文档中提到可以用ggthemr_reset()来恢复ggplot2默认风格,但笔者经过实践发现这个函数并不能彻底抹除之前施加的主题模式,因此这里不细说,读者们可以自行尝试;
三、自定义主题
尽管ggthemr内建了很多风格迥异的主题,有的过于花哨,有的又过于商务硬朗,除了直接套用这些主题,我们还可以自己创建新的主题以加入自己对构图的想法:
3.1 Palettes(调色板)
palette决定了图像中所有元素的颜色,包括所有图层、背景、网格线等,而swatch则专门用于控制图层元素的配色方案,我们使用define_palette()来构造自定义调色方案,其主要参数如下:
swatch:一个颜色向量,用于定义图层元素的配色方案(要注意图像中需要用到的色彩数量要小于等于swatch的向量长度,否则会报错)
gradient:一个长度为2的向量,lower位置和upper位置用于控制梯度色彩的上下限
background:设置背景色彩
text:设置文本部分的字体颜色
line:设置坐标轴颜色
gridline:控制网格线的颜色
下面我们自定义一个色彩简单的主题:
demo <- define_palette(
swatch = c('black', 'red', 'green', 'blue', 'brown', 'purple', 'yellow'),
gradient = c(lower = 'red', upper = 'green')
) ggthemr(demo)
下面来看看应用上述主题之后的图像效果:
rm(list=ls())
library(ggplot2)
library(ggthemr) data(mpg)
data <- mpg demo <- define_palette(
swatch = c('black', 'red', 'green', 'blue', 'brown', 'purple', 'yellow'),
gradient = c(lower = 'red', upper = 'green')
) ggthemr(demo)
p <- ggplot(data=data, aes(displ, hwy))+
geom_point(mapping = aes(shape=factor(cyl)))+
geom_smooth(mapping = aes(displ,hwy,colour=factor(cyl)))
print(p)
因为我们的demo主题中还设置了色彩梯度,下面我们绘制密度图(此例来自我的(数据科学学习手札38)ggplot2基本图形简述):
data <- data.frame(matrix(rnorm(),nrow=))
p <- ggplot(data, aes(x = X1, y = X2)) +
stat_density2d(aes(fill = ..density..), geom = "raster", contour = F)
p
可以看到,密度图中色彩在预设的红色与绿色之间过渡;
3.2 ggthemr()的其他关键参数
前文中我们使用函数ggthemr()来挂载主题,而除了最关键的主题参数之外,ggthemr()还有若干控制其他图像样式的参数,如下:
layout:用于网格线样式,有clean、clear、minimal、plain、scientific可选,默认clear
spacing:用于控制图像在图床上的紧凑程度,越高意味着图像被挤压得越严重,默认1.6,下面分别为0,1,2时的示例:
text_size:用于控制文本部分字体大小,默认12
type:用于控制背景区域填充的形式,当'inner'时如下:
当设置为'outer'时如下:
line_weight:设置坐标轴和网格线的宽度,默认0.5
set_theme:逻辑型变量,控制是否启动palette传入的主题,默认为TRUE
3.3 微调图像对比度
ggthemr中十分贴心地提供了调节图像对比度的函数,具体如下:
darken_swatch()
/ lighten_swatch()
: 暗化或亮化所有图形元素的对比度
darken_gradient()
/ lighten_gradient()
: 暗化或亮化所有梯度元素的对比度
darken_palette()
/ lighten_palette()
: 暗化或亮化所有元素的对比度
下面是简单的示例:
rm(list=ls())
library(ggplot2)
library(ggthemr) data(mpg)
data <- mpg ggthemr('chalk')
p1 <- ggplot(data=data, aes(displ, hwy))+
geom_point(mapping = aes(shape=factor(cyl)))+
geom_smooth(mapping = aes(displ,hwy,colour=factor(cyl)))
print(p1)
下面我们来分别调低和调高全局色彩对比度:
darken_palette(amount = 0.5)
print(p1)
lighten_palette(amount = 0.5)
print(p1)
以上就是本文的全部内容,如有笔误望指出。
参考资料:https://github.com/cttobin/ggthemr
(数据科学学习手札55)利用ggthemr来美化ggplot2图像的更多相关文章
- (数据科学学习手札57)用ggplotly()美化ggplot2图像
一.简介 经常利用Python进行数据可视化的朋友一定用过或听说过plotly这样的神器,我在(数据科学学习手札43)Plotly基础内容介绍中也曾做过非常详细的介绍,其渲染出的图像以浏览器为载体,非 ...
- (数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)
一.简介 接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文 ...
- (数据科学学习手札47)基于Python的网络数据采集实战(2)
一.简介 马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集 ...
- (数据科学学习手札44)在Keras中训练多层感知机
一.简介 Keras是有着自主的一套前端控制语法,后端基于tensorflow和theano的深度学习框架,因为其搭建神经网络简单快捷明了的语法风格,可以帮助使用者更快捷的搭建自己的神经网络,堪称深度 ...
- (数据科学学习手札42)folium进阶内容介绍
一.简介 在上一篇(数据科学学习手札41)中我们了解了folium的基础内容,实际上folium在地理信息可视化上的真正过人之处在于其绘制图像的高度可定制化上,本文就将基于folium官方文档中的一些 ...
- (数据科学学习手札40)tensorflow实现LSTM时间序列预测
一.简介 上一篇中我们较为详细地铺垫了关于RNN及其变种LSTM的一些基本知识,也提到了LSTM在时间序列预测上优越的性能,本篇就将对如何利用tensorflow,在实际时间序列预测任务中搭建模型来完 ...
- (数据科学学习手札36)tensorflow实现MLP
一.简介 我们在前面的数据科学学习手札34中也介绍过,作为最典型的神经网络,多层感知机(MLP)结构简单且规则,并且在隐层设计的足够完善时,可以拟合任意连续函数,而除了利用前面介绍的sklearn.n ...
- (数据科学学习手札32)Python中re模块的详细介绍
一.简介 关于正则表达式,我在前一篇(数据科学学习手札31)中已经做了详细介绍,本篇将对Python中自带模块re的常用功能进行总结: re作为Python中专为正则表达式相关功能做出支持的模块,提供 ...
- (数据科学学习手札69)详解pandas中的map、apply、applymap、groupby、agg
*从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一.简介 pandas提供了很多方 ...
随机推荐
- Python学习---网页爬虫[下载图片]
爬虫学习--下载图片 1.主要用到了urllib和re库 2.利用urllib.urlopen()函数获得页面源代码 3.利用正则匹配图片类型,当然正则越准确,下载的越多 4.利用urllib.url ...
- flume MemoryChannel 源代码解析
1.先分析三个LinkedBlockingDeque<Event>类型的takeList,putList,queue putList: 存放的是来自source生产的数据,通过调用doP ...
- gluoncv训练faster rcnn的一点小问题
gt数目超过上限. https://github.com/dmlc/gluon-cv/pull/335/files
- [CQOI2017]小Q的表格
题目 神仙题,神仙题 这是一道很适合盯着发呆的题目 看到这个规律 \[ f(a,b)=f(b,a) \] \[ b\times f(a,a+b)=(a+b)\times f(a,b) \] 这也没什么 ...
- FireFox新标签页打开搜索和书签
FireFox更新,发现界面完全不适应,虽然他是越做越丑,但是也没办法,一直用FireFox,许多书签,保存的密码现在都记不住了,只能靠保存的自动填充.... 进入正题,FireFox更新了之后,搜索 ...
- Python 多线程 线程安全、daemon简介 (四)
线程安全 只能在Winodws下的ipython中演示,Python命令行.Pycharm.Mac下的ipython都演示不出效果 import threading def worker(): for ...
- Java类加载机制与Tomcat类加载器架构
Java类加载机制 类加载器 虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类.实现这 ...
- 【luogu P1558 色板游戏】 题解
题目链接:https://www.luogu.org/problemnew/show/P1558 我知道三十棵线段树很暴力,可是我们可以状压啊. 颜色最多30,不会爆int 另外 吐槽评测机 #inc ...
- oracle11g之管理oracle数据库笔记(理论基础知识)
第三章 管理oracle数据库 1.启动数据库步骤;(创建启动实例--> ...
- 解决dpdk中出现IOMMU not found的问题
问题 在使用VFIO前,需要在BIOS打开VT-x和VT-d,想把一个PCIe网卡透传到虚拟机中,发现虚拟机启动失败,提示IOMMU没有找到. 输入以下命令确定vt-d开启 dmesg | grep ...