R内存管理与垃圾清理
1.内存查看
memory.limit():查看内存大小 memory.limit(n):申请内存大小 memory.size(NA):查看内存大小 memory.size(T):查看已分配的内存 memory.size(F):查看已使用的内存
2.内存申请
在Windows开始菜单运行:
Rgui -max-mem-size 8GB
与在R GUI中执行:
memory.limit(8)
都能申请8GB使用内存
3.垃圾清除
rm(x):从workplace中删除变量/文件x gc():清除内存垃圾 rm(list=ls()):清除workplace中所有变量
4.提升R的性能和突破内存限制的技巧
4.1性能提升的方法
4.1.1 系统升级
升级硬件
使用64位操作系统
利用GPU
租用云计算服务器
4.1.2 开发层面的优化
算法降低算法复杂度
调用C/C++或者Fortran关键的、耗时的计算步骤
缓冲技术减少重复计算
4.1.3 使用层面的优化
充分利用R的内存机制——R的基础优化
增强R的矩阵运算——加速BLAS
并行计算
大规模数据的处理——图片内存限制
使用Revolution R Enterprise(RRE)
4.2 充分利用R的内部机制优化性能
4.2.1向量化
向量化的代码,不要用循环!
利用矩阵运算
利用内置的向量化函数,比如exp、sin、rowMeans、rowSums、colSums、ifelse等
利用Vectorize函数将非向量化的函数改装为向量化的函数
*apply函数族:apply、lapply、sapply、tapply、mapply等
plyr和dplyr包Rstudio发布的data wrangling cheat sheet
##利用矩阵运算
n <-
x1 <- :n
x2 <- :n
y <- vector()
system.time(
    :n){y[i] <- x1[i] + x2[i]}
)
system.time(y <- x1 + x2)
## 利用向量化运算
## 内置的向量化函数
v <- :
result <- rep(:)
system.time(
    :){result[i] <- sin(v[i])}
)
system.time(result <- sin(v))
## 利用rowMeans、rowSums、colSums、colMeans等函数对矩阵或数据库做整体处理
colSums(iris[,:])
利用R内置的向量化函数,自定义向量化函数,只要在函数定义时每个运算是向量化的。但是在函数定义时用了逻辑判断语句,就会破坏的向量化特征。
func <- function(x){
     == ){
        ret <- TRUE
    }else{
        ret <- FALSE}
    return(ret)
}
func()
func(c(,,,))
## Warning message:
## In  == ) { :
##   the condition has length >  and only the first element will be used
## 在函数的定义中有if语句,不能接受向量作为判断的条件,否则判断第一个元素。
## 利用ifelse函数做向量化的判断
myfunc <- function(x){
    ifelse(x %%  == ,TRUE,FALSE)
}
myfunc(c(,,,))
##利用Vectorize函数将非向量化的函数改装为向量化的函数
funcv <- Vectorize(func)
funcv(c(,,,))
##利用sapply函数向量化运算
sapply(c(,,,),func)
4.2.2预先给对象分配内存
R为解释性语言,也是动态语言,如果不事先指定对象的类型和长度,在运算过程会动态分配内存,提高灵活性,但降低了效率。
尽量减少cbind、rbind的使用
## 求出10000个斐波那契数
x <- c(,)
i <-
system.time(
    ){
        ]
        x <- cbind(x,new)
        i <- i +
    }
)
## 指定类型和长度
x <- vector(mode=)
x[] <-
x[] <-
system.time(
    ){
        i <- i +
        x[i] <- x[i-] + x[i-]
    }
)
4.2.3避免内存拷贝
假设我们有许多彼此不相关的向量,但因为一些其他的原因,我们希望将每个向量的第三个元素设为8,既然它们是互不相关的,甚至可能具有不同的长度,我们也许会考虑将它们放在一个列表中:
m <- n <- z <- list() :m) z[[i]] <- sample(:, n, replace = T) system.time(:m) z[[i]][] <- ) ## 把这些向量一起放到矩阵中 z <- matrix(sample(:, m * n, replace = T),nrow = m) system.time(z[,] <- )
4.2.4删除临时对象和不再用的对象
rm()删除对象
rm(object)删除指定对象,rm(list = ls())可以删除内存中的所有对象gc()内存垃圾回收
使用rm(object)删除变量,要使用gc()做垃圾回收,否则内存是不会自动释放的。invisible(gc())不显示垃圾回收的结果
4.2.5分析内存的函数
ls()列出特定环境中的对象object.size()返回R对象的大小(近似的)memory.profile()分析cons单元的使用情况memory.size()监测全部内存的使用情况(仅Windows下可用)
memory.size(max=T)返回历史占用过的最大内存;memory.size(max=F)返回目前占用的内存。未做垃圾清理时,已使用内存和已分配内存同步增加,但在垃圾清理后rm(list=ls());gc(),已使用内存会减少,而已分配给R的内存不会改变。memory.limit()系统可分配的内存上限(仅Windows下可用)
memory.limit(newLimit)更改到一个新的上限。 注意,在32位的R中,封顶上限为4G,你无法在一个程序上使用超过4G (数位上限)。这种时候,可以考虑使用64位的版本。
参考链接:https://segmentfault.com/a/1190000006001525
R内存管理与垃圾清理的更多相关文章
- 【R笔记】R的内存管理和垃圾清理
		
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm( ...
 - Java之美[从菜鸟到高手演变]之JVM内存管理及垃圾回收
		
很多Java面试的时候,都会问到有关Java垃圾回收的问题,提到垃圾回收肯定要涉及到JVM内存管理机制,Java语言的执行效率一直被C.C++程序员所嘲笑,其实,事实就是这样,Java在执行效率方面确 ...
 - Java内存管理和垃圾回收
		
笔记,深入理解java虚拟机 Java运行时内存区域 程序计数器,线程独占,当前线程所执行的字节码的行号指示器,每个线程需要记录下执行到哪儿了,下次调度的时候可以继续执行,这个区是唯一不会发生oom的 ...
 - JVM内存管理及垃圾回收【转】
		
很多Java面试的时候,都会问到有关Java垃圾回收的问题,提到垃圾回收肯定要涉及到JVM内存管理机制,Java语言的执行效率一直被C.C++程序员所嘲笑,其实,事实就是这样,Java在执行效率方面确 ...
 - V8 内存管理和垃圾回收机制总结
		
这篇文章主要介绍 V8 的内存管理和垃圾回收知识. V8 内存管理及垃圾回收机制浅析 由于 V8 引擎的原因,Node 在操作大内存对象时受到了一些限制,在 64 位的机器上,默认最大操作的对象大小约 ...
 - C#内存管理与垃圾回收
		
垃圾回收还得从根说起,就像生儿育女一样. 根:根是一个位置,存放一个指针,该指针指向托管堆中的一个对象,或是一个空指针不指向任何对象,即为null.根存在线程栈或托管堆中,大部分的跟都在线程栈上,因为 ...
 - 使用虚幻引擎中的C++导论(四-内存管理与垃圾回收)(终)
		
使用虚幻引擎中的C++导论(四)(终) 第一,这篇是我翻译的虚幻4官网的新手编程教程,原文传送门,有的翻译不太好,但大体意思差不多,请支持我O(∩_∩)O谢谢. 第二,某些细节操作,这篇文章省略了,如 ...
 - javascript中的内存管理和垃圾回收
		
前面的话 不管什么程序语言,内存生命周期基本是一致的:首先,分配需要的内存:然后,使用分配到的内存:最后,释放其内存.而对于第三个步骤,何时释放内存及释放哪些变量的内存,则需要使用垃圾回收机制.本文将 ...
 - 面试题之C# 内存管理与垃圾回收
		
面试题之C# 内存管理与垃圾回收 你说说C# 的内存管理是怎么样的 这句话我记了一个多礼拜了, 自从上次东北师大面试之后, 具体请看<随便扯扯东北师大的面试>. 国庆闲着没事, 就大概了解 ...
 
随机推荐
- 第3月第21天 nsclassfromstring返回null SVN报错:clean the working copy and then retry the operation
			
1. xcodeproj工程损坏时,.m文件没有加入编译. 2. SVN报错:clean the working copy and then retry the operation http://bl ...
 - linux centos 6.5下安装nodejs
			
1.将文件下载或拷贝至/usr/local/src目录下,可使用xshell工具上传文件 2.解压缩文件: tar xvf /usr/local/src/node-v6.9.2-linux-x64 3 ...
 - python调用其他程序或脚本方法(转)
			
python运行(调用)其他程序或脚本 在Python中可以方便地使用os模块运行其他的脚本或者程序,这样就可以在脚本中直接使用其他脚本,或者程序提供的功能,而不必再次编写实现该功能的代码.为了更好地 ...
 - Docker知识-1
			
[编者的话]本文用图文并茂的方式介绍了容器.镜像的区别和Docker每个命令后面的技术细节,能够很好的帮助读者深入理解Docker. 这篇文章希望能够帮助读者深入理解Docker的命令,还有容器(co ...
 - html图标插件
			
https://bitbucket.org/cleonello/jqplot/downloads/ 下载地址 http://www.cnblogs.com/yaozhenfa/p/jqplot-pie ...
 - CentOS下采用Crontab实现PHP脚本定时任务
			
简单实现一个需求,每5分钟往特定表中插入2条数据.经过分析还是采用crontab方式靠谱,另外执行php脚本的方式,不用担心链接超时等问题. 1.准备工作,创建1个数据表“person”, CREAT ...
 - Java笔记:修饰符
			
Synchronized 修饰符 Synchronized 关键字声明的方法同一时间只能被一个线程访问.Synchronized 修饰符可以应用于四个访问修饰符. 实例 public synchron ...
 - iOS推送小结(证书的生成、客户端的开发、服务端的开发)
			
1.推送过程简介 1.1.App启动过程中,使用UIApplication::registerForRemoteNotificationTypes函数与苹果的APNS服务器通信,发出注册远程推送的申请 ...
 - [Python数据分析]新股破板买入,赚钱几率如何?
			
这是本人一直比较好奇的问题,网上没搜到,最近在看python数据分析,正好自己动手做一下试试.作者对于python是零基础,需要从头学起. 在写本文时,作者也没有完成这个小分析目标,边学边做吧. == ...
 - python之线程进程协成
			
线程与进程 什么是线程 线程是进程一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位,线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源,但是它可与同属一个线程的 ...