R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~
———————————————————————————
2016年11月1日,RStudio 1.0版本正式发布!这是自2011年2月RStudio发布以来的第10个主要版本,也是更新最大的一次。主要亮点如下:
1.R Notebooks 的辅助工具(实时反馈结果,这个RMD做不来)
2.对sparklyr包的集成支持(R与Spark连接)
3.profvis包进行性能分析(代码运行步骤、代码运行时间)
4.基于readr/readxl/haven,优化数据读取(任意修改载入行名、列名以及一些字符串处理)
5.R Markdown的辅助工具(websites和bookdown包)
6.其他优化和bug修复
——部分内容参考自:R语言中文社区
下载链接:https://www.rstudio.com/products/rstudio/download3/
闲慢的可以看看我下的百度云盘链接:链接:http://pan.baidu.com/s/1b5A5Y2 密码:xlmg
(版本:RStudio-1.0.44)
————————————————————————————————————
一、R notebook
1、安装问题
如果R的版本够的话,需要预装knitr,rmarkdown,同时你点击R notebook就会直接帮你加载。
但是另外一台电脑在低版本的R中,3.1好像需要加装tibble 1.0,并且尝试了还是用不来,报错:
tibble1.1 is required but 1.0 is available
会让你check that getOption("repos")看看版本对不对,不够我加载得对的tibble包,还是没用,所以不知道是不是版本问题。
2、界面
界面跟Rmarkdown差不多,查看R语言自动化报告格式——knitr
有以下几个新功能点:
为 R Markdown增添一个强大的创作引擎。在数据分析领域,R Notebooks 具有极为引人注目的优势!
(1)实时反馈结果
可以看到代码运行到哪一步以及每步的运行结果;可以实时反馈结果,如果是传统的R Markdown模式,每次修改都需要重新knit(你懂的)才能看到效果,如果遇到大规模的计算,需要等上半天。
而在R Notebooks中,你可以立即看到你执行的代码的效果。此处“效果”包括各种内容:控制台打印结果、绘制图表、数据框,甚至交互的HTML控件。
(2)兼容其他语言
R Notebooks不仅可以运行R代码,还可以运行 Python, Bash, SQLor C++ (Rcpp).直接用SQL语句,牛不牛!
(3)其他:丰富的输出格式。即时查看功能以及分享功能。
————————————————————————————————————
二、sparkR
Sparklyr 包是一个新的接口在R与Apache Spark. RStudio现在集成支持Spark和sparklyr包,主要工具如下:
1.创建和管理Spark连接
2.浏览表和Spark数据框的列
3.预览Spark数据框的前1000行
一旦安装好sparklyr包,你就可以发现Spark面板。这个面板包括一个新的连接,可以用于本地或者远程spark实例连接。
连接成功后,你可以看淡Spark集群中的数据表。
使用RStudio浏览Spark数据框中的数据。
————————————————————————————————————————————————————
三、Profiling with profvis——代码测试神器
每一步代码的耗时,有了这个无疑在写函数的时候,就能够很好地对自己的代码进行测试,提高编译效率。笔者觉得这个乃是本次更新最大亮点。
在栏目中就有这个,你可以指定行进行测试,用"profile selected Line(s)"
也可以用"start profilling " 一步一步测试,直到你的代码截止,然后点击“stop profilling”
1、分析结果解读一:代码运行步骤
在分析结果中主要有两块内容:上部,是代码本身,以及执行每一行所消耗的内存及时间;下部是一个火焰图(什么鬼),显示R在执行过程中具体干了啥,横向从左到右代表时间轴,纵向代表了调用栈也就是当前调用的函数。
分析结果还有个Data页,点开来是个调用树,展示了各个函数调用的花费情况(仍然是内存及时间)。
2、分析结果解读二:代码运行时间
分析结果还有个Data页,点开来是个调用树,展示了各个函数调用的花费情况(仍然是内存及时间)。
`a <- 1`代码可以调戏profvis
(本节内容来自公众号子豹)
————————————————————————————————————
四、数据输入——新手数据导入福音
RStudio 现在集成了readr/readxl/haven包,以提供高效的工具实现不同格式文件的导入。可以直接支持:
导入的界面很亲民,同时把调用的代码也显示出来,新手可以来这看看,免去了很多麻烦!!
1、功能点一:指定输入数据是否需要行名
于是我们指定跳过6行记录,并且不要将第一行作为列名。
但是有些字段明明是数字却被显示成了字符串,可以直接在列名的下拉框里进行修正。(来源公众号:子豹)
R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)的更多相关文章
- VisualCom软件仿真平台V1.0发布(附安装包下载链接)
自我们借助VisualCom(暂定名称,后续可能会变更)软件平台撰写技术文章以来,有不少粉丝发私信询问该软件哪里来的,以及哪里有安装包,这里回复一下:VisualCom软件平台是由本微信公众号组织开发 ...
- poi报表导出4.1.0版本工具类 导出并下载
这一段时间,由于项目上线基于稳定,所以我这边在基于我们一期迭代的分支上优化一部分我们之前没有做的功能,报表导出.本身之前用的是3.5的版本,但是由于同事要写导入,写的代码只有4.1.0的版本支持,所以 ...
- [JavaEE] JBoss主要版本下载链接一览
URL: http://teddysun.com/260.html JBoss在2006年被 RedHat 收购.在各种 J2EE 应用服务器中,JBoss 是最受欢迎而且功能最为强大的应用服务器.不 ...
- R︱Linux+Rstudio Server尝鲜笔记(打造最佳Rstudio体验+报错的解决方案)
Rstudio Server 是Rstudio开发的基于R语言的网页版(只能在Linux),你在手机上都可以运行R,还是挺方便的.就是配置起来有点麻烦. 官方下载链接:https://www ...
- 从[Greenplum 6.0] 1分钟安装尝鲜开始
Greenplum目前6版本目前已经迭代了几个小版本了,随着版本的更新,不断的有bug被修复. 打算试用的朋友可以入手了. 作为开年的第一个工作日的第一个帖子,必须从“开天辟地”的6.0开始.以下内容 ...
- 尝鲜刚发布的 SpringFox 3.0.0,以前造的轮子可以不用了...
最近 SpringFox 3.0.0 发布了,距离上一次大版本2.9.2足足有2年多时间了.可能看到这个名字,很多读者会有点陌生.但是,只要给大家看一下这两个依赖,你就知道了! <depende ...
- linux中conda升级R到4.0?
目录 前言 问题 曲线救国 前言 虽然我的win版本R已经用4了,但之前在Linux环境一直没用R4.0,因为Linux涉及的东西太多,担心不稳定,牵一发而动全身. 但现在有好些R包必须要用更新到R4 ...
- Spring Boot 2.0(二):Spring Boot 2.0尝鲜-动态 Banner
Spring Boot 2.0 提供了很多新特性,其中就有一个小彩蛋:动态 Banner,今天我们就先拿这个来尝尝鲜. 配置依赖 使用 Spring Boot 2.0 首先需要将项目依赖包替换为刚刚发 ...
- Win10尝鲜体验——初识传说中不一样的Windows 分类: 资源分享 2015-07-24 18:27 13人阅读 评论(0) 收藏
这几天,网上传来一个消息,虽然不知是好是坏,Win10可以下载安装了! 出于好奇,下载尝鲜,几个截图,留作纪念~ 中文,还是要好好支持的,毕竟中国有如此多的用户 可选的安装版本 许可条款也刚刚出炉,估 ...
随机推荐
- HTML——filedset和legend标签
1.<filedset>定义围绕表单中元素的边框. 2.legend 元素表示作为 legend 元素的父元素的 fieldset 元素的其余内容的标题(caption). 使用案例: & ...
- tf.train.shuffle_batch函数解析
tf.train.shuffle_batch (tensor_list, batch_size, capacity, min_after_dequeue, num_threads=1, seed=No ...
- rsync推送和拉取
rsync格式: # 拷贝本地文件.当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式.如:rsync -a /data /backup rsync [OP ...
- jboss7.1.1相关error及解决办法
问题1: 报错提示: 公司的网站系统使用的中间是jboss7.1.1 Final,由于有些数据和服务测试环境不具备,免不了要在测试环境调试些jsp页面,发现从jboss社区里下载的jboss应用有个问 ...
- MySQL系统临时表、用户临时表
MySQL临时表分为系统使用的临时表和用户使用的临时表. 系统使用的临时表是指MySQL在执行某些SQL语句时需要依赖临时表来完成整个过程.系统使用的临时表的情况可以分为以下几种: * group ...
- 编写服务器程序时遇到的connect:no route to host的问题
亲测,,ftp服务器:在一台虚拟机上,没有问题.但是在不同的计算机或虚拟机上就会出现这种错误提示.一般是linux防火墙的问题 解决方法: 关闭linux防火墙 在root账户下 命令行:servic ...
- django-rest-framework之基于类的视图
前言:上一篇博客中,主要讲的是请求和响应,项目里面views.py中的视图函数都是基于函数的,并且我们介绍了@api_view这个很有用的装饰器.同时,我们还介绍了APIView这个类,但是还没使用它 ...
- XML+JSON面试题都在这里
XML+JSON常见面试题 什么是JSON和XML 什么是JSON和XML JSON:JavaScript Object Notation [JavaScript 对象表示法]. XML:extens ...
- CNN网络架构演进:从LeNet到DenseNet
卷积神经网络可谓是现在深度学习领域中大红大紫的网络框架,尤其在计算机视觉领域更是一枝独秀.CNN从90年代的LeNet开始,21世纪初沉寂了10年,直到12年AlexNet开始又再焕发第二春,从ZF ...
- PHP执行Session与前端JS之间的关系
<?php error_reporting(0); $path = './tmp/'; $sess_name = session_name(); echo $sess_name; $sess_i ...