Zeppelin0.6.2+sparkR2.0.2环境搭建
0.序
先吐槽一下网上旧版本的Zeppelin和R的安装,让我折腾了几个小时。
不过最终还是调通了也不容易,其实我现在一点R都没有学呢,只是刚看了一节课,但是这个工具既然出现在了Spark中,我想它还是蛮流行和好用的。
之前配置了Zeppelin的Spark的结合,但是那没有配置R的部分,但是Zeppelin既然能够有这么多的解释器,在我看来就是凸显他的一个别的软件所不具有的优势:那就是在一个note里你可以使用多种解释器来编写文字,生成图像,分析一个问题。
再加上方便的导入导出和存储功能,我个人感觉未来流行只是时间问题。
废话尽量少说,进入正题:
1.安装R及相关的包:
注意我使用的是CentOS7的系统,如果你不是我的系统可能下载的包会不一致。不过请不要担心,我会尽量说明白如何找到对应系统的R的安装包。
首先访问官网https://www.r-project.org/
然后我们找到这个:

然后找到China那一栏,随便点一个地址就好。
然后我们选择这个:

这下你应该能找到了吧,里面包含几种常用Linux发行版,我的是CentOS,自然是选择RedHat系列了。
然后我们依次点下去,直到点开README

很好,这里似乎要安装一个EPEL的源来完成我们的R包的安装,这里我们进入划横线的网址:

箭头所指是这个源的RPM包,下载并安装之!
wget https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
rpm -ivh epel-release-latest-.noarch.rpm
接下来我打开这个网址:https://zeppelin.apache.org/docs/0.6.2/interpreter/r.html
安装相关R以及相关依赖:
yum install R R-devel libcurl-devel openssl-devel
安装时间比较长,耐心等待,去喝杯咖啡或者看会别的,再回来吧!
不过你要是一直细心看的话,它竟然在处理依赖关系的时候自动给安装上了open-jdk,没事,我们使用以下方式解决:
wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u112-b15/jdk-8u112-linux-x64.rpm
rpm -ivh jdk-8u112-linux-x64.rpm
再给它安装回去-。-醉了。
安装一些官网所说的依赖:
R -e "install.packages('devtools', repos = 'http://cran.rstudio.com')"
R -e "install.packages('knitr', repos = 'http://cran.rstudio.com')"
R -e "install.packages('ggplot2', repos = 'http://cran.rstudio.com')"
R -e "install.packages(c('devtools','mplot', 'googleVis'), repos = 'http://cran.rstudio.com'); require(devtools); install_github('ramnathv/rCharts')"
2.配置Zeppelin
复制官网的一段话:
Configuration
To run Zeppelin with the R Interpreter, the SPARK_HOME environment variable must be set. The best way to do this is by editing conf/zeppelin-env.sh. If it is not set, the R Interpreter will not be able to interface with Spark.
You should also copy conf/zeppelin-site.xml.template to conf/zeppelin-site.xml. That will ensure that Zeppelin sees the R Interpreter the first time it starts up.
两个步骤:
- 在conf/zeppelin-env.sh中加入SPARK_HOME这个环境变量
- cp
conf/zeppelin-site.xml.templateconf/zeppelin-site.xml
此处不再赘述。
3.重启Zeppelin:
/opt/zeppelin-0.6.-bin-all/bin/zeppelin-daemon.sh restart
4.验证环境是否装好:
打开浏览器进入Zeppelin的地址,然后notebook -> R Tutorial
如下图

等待编译完成,然后我截取了几张图片放在下面:



好,我们的SparkR环境搭建好了,Zeppelin又多了一个新的工具,又强大了不少。
Zeppelin0.6.2+sparkR2.0.2环境搭建的更多相关文章
- android 5.0开发环境搭建
Android 5.0 是 Google 于 2014 年 10 月 15 日发布的全新 Android 操作系统.本文将就最新的Android 5.0 开发环境搭建做详细介绍. 工具/原料 jdk- ...
- Jira 6.0.5环境搭建
敏捷开发-Jira 6.0.5环境搭建[1] 我的环境 Win7 64位,MSSql2008 R2,已经安装tomcat了 拓展环境 jira 6.0.5 百度网盘下载 ...
- selenium win7+selenium2.0+python环境搭建
win7+selenium2.0+python环境搭建 by:授客 QQ:1033553122 步骤1:下载python 担心最新版的支持不太好,这里我下载的是python 2.7(selenium之 ...
- CentOS7 Redis5.0.5环境搭建
CentOS7 Redis5.0.5环境搭建 1基本环境配置 CentOS Linux release 7.6.1810 (Core) redis 5.0.5 1.下载解压redis.通过wget在官 ...
- faster-rcnn(testing): ubuntu14.04+caffe+cuda7.5+cudnn5.1.3+opencv3.0+matlabR2014a环境搭建记录
python版本的faster-rcnn见我的另一篇博客: py-faster-rcnn(running the demo): ubuntu14.04+caffe+cuda7.5+cudnn5.1.3 ...
- Sqoop-1.4.6.bin__hadoop-2.0.4-alpha 环境搭建
一.Sqoop 环境搭建 1.下载安装包及解压 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 1)拷贝sqoop-1.4.6.bin__hadoop-2 ...
- CC++初学者编程教程(2) Microsoft Visual C++ 6.0开发环境搭建
上一篇演示的是如何安装VS2010,本文演示的是如何安装Microsoft Visual C++ 6.0 简称VC6. 有同学经常VC6都是很古董的版本了,为啥他还存在,不得不说VC6是微软一个很经典 ...
- Hadoop-2.8.0 开发环境搭建(Mac)
Hadoop是一个由Apache基金会开发的分布式系统架构,简称HDFS,具有高容错性.可伸缩性等特点,并且可以部署在低配置的硬件上:同时,提供了高吞吐量的数据访问性能,适用于超大数据集的应用程序,以 ...
- cocos2dx 3.0 +VS2013 环境搭建
1.需要javasdk,android sdk,ndk,python 2.各种环境变量配置如下: JAVA_HOME:C:\Program Files\Java\jdk1.7.0_67 Path:%J ...
随机推荐
- Sping——使用注解创建切面
为讲解例子,我们首先定义一个Performance接口: package aoptest; public interface Performance { public void perform(); ...
- Spring装配之——JAVA代码装配Bean
首先创建几个普通的JAVA对象,用于测试JAVA代码装配bean的功能. package soundsystemJava; //作为接口 定义了CD播放器对一盘CD所能进行的操作 public int ...
- Linux之iptables(一、防火墙的概念)
防火墙的概念 一.安全技术 入侵检测与管理系统(Intrusion Detection Systems):特点是不阻断任何网络访问,量化.定位来自内外网络的威胁情况,主要以提供报告和事后监督为主,提供 ...
- 优化JAVA查询Mongodb数量过大,查询熟读慢的方法
前言:2018年的时候优化了一个项目,该项目从MOngodb中获取数据的时候一次去十万百万千万的数据过慢,往往每次都要二十秒,三十秒,今天提出了一个代码优化的方案 项目查从mongodb中获取数据:代 ...
- 《AlwaysRun!》第八次团队作业:Alpha冲刺 第二天
项目 内容 这个作业属于哪个课程 老师链接 这个作业的要求在哪里 实验十二 团队作业8:软件测试与Alpha冲刺 团队名称 Always Run! 作业学习目标 (1)掌握软件测试基础技术. ( ...
- 曾经遇过的sql问题
曾经遇过的sql问题 问题一: 语句1: select SUM(level) from Comment 语句2: ELSE SUM(level) END as totalLevel from Comm ...
- 解决Eclipse导入项目后Validating验证缓慢的问题
减少不必要的验证即可 步骤:Window-Preferences-左侧的Validation 如图所示,将Build一列的勾全部去掉就好了. 如需手动校验,右键项目名-选择Validate即可.
- [Cogs727] [网络流24题#2] 太空飞行计划 [网络流,最小割]
建图:源点—(w[i])—>实验—(∞)—>仪器—(cost[i])—>汇点, 如果该实验造成收益,则仪器到汇点的边在最小割中, 如果该实验造成损失,则源点到实验的边在最小割中, 故 ...
- LSB、MSB是什么单位
最低有效位 (LSB: Least Significant Bit) 最低有效位(LSB)是给这些单元值的一个二进制整数位位置,就是,决定是否这个数字是偶数或奇数.LSB有时候是指最右边的位,因为 ...
- Git 主要的工作流程
Git使用个进制字符的SHA- Hash来唯一标识对象 如:e98757d0598ab6eeaf1df0d87dd00826048bd80b git 有种对象 1.blob 表示文本文件,二进制文件或 ...