一、在虚拟机中安装R语言

1.下载R语言压缩包R-3.2.2.tar.gz,放在目标目录下

★在此特别提醒,尽量安装3.2.?版本的R,更高版本的R容易出现依赖包安装不全的问题。

# mv R-3.2.2.tar.gz /home/hadoop

下载R语言压缩包建议采用以下两种方式:

一是在本机上使用浏览器下载好R语言的压缩包,再通过WinSCPPortable工具再发送到虚拟机。

二是直接在虚拟机中下载,使用命令#wget https://cran.r-project.org/src/base/R-3/R-3.2.2.tar.gz下载R语言压缩包。

2.将压缩包解压缩

# tar -zxf R-3.2.2.tar.gz

3.安装R语言依赖包

R语言运行依赖相关程序包,可以通过root身份进行安装。

安装R语言依赖包需要联网进行,所以在进行此步之前要先实现虚拟机的网络连接。

#yum install gcc -y

#yum install gcc-c++ -y

#yum install gcc-gfortran -y

#yum install readline-devel -y

#yum install libXt-devel -y

#yum install libpng-devel -y

4.编译安装

使用makr方法对R语言进行编译安装。

#cd /home/hadoop/R-3.2.2

#./configure --enable-R-shlib --with-x --with-libpng --with-jpeglib

#make && make install

5.检测R是否安装成功

使用命令行R进入R的编译模式并检测R是否安装成功。

出现如上界面说明R语言安装成功。

二、安装SparkR运行环境

1.安装依赖包

以root身份安装SparkR依赖包。

#yum install libcurl-devel -y

#yum install openssl-devel -y

#yum install libxml2-devel -y

2.在R Shell中安装相关依赖包

在安装依赖包时,会提示选择最佳的镜像站点,可以根据需要选择。

#R

>install.packages("rJava")

>install.packages("devtools")

>install.packages("git2r)

>install.packages("xml2")

>install.packages("rversions")

由于后续实例中需要画图,需要加入png、jpeg等支持,所以还需安装如下依赖包。

>install.packages("png")

>install.packages("jpeg")

三、安装SparkR

在某一版本后的Spark中,已经内置了SparkR,直接调用就可以了。

在此,安装的是Spark1.6.3。

四、启动并验证安装

首先启动R shell,然后加载SparkR。

#R

>library(SparkR)

报错及解决方法:

1. 编译R语言时 

解决方法:yum install readline-devel

2. 下载依赖包时提示

解决方法:出现如上提示通常是网络问题

使用NAT方式进行网络连接,共享主机的网络。特别需要提醒的是,虚拟机中节点的网关和DNS问题。

在此处GATEWAY的最后一位不是1而是2。同时要确保虚拟机的DNS和主机的DNS一样。

3.编译R语言时报错

这个问题简单来说,就是从16年开始,R的新版本去除了一些原来包含在安装包里的包,并默认这些包已经安装在你的系统里,这时候,如果你用的是自己本地较新的linux/mac/windows版本,默认已经装好这些包,即使没有也能够很快安装或者更新这些包。但是,如果你是在服务器集群上,没有管理员权限,需要将这些包先安装在自己的目录下,然后才能调用,而关键的问题就是调用时的环境变量如何设置。

解决方法:安装较低版本的R语言,建议安装R-3.2.?版本的R,不容易出错。也可安装R-3.3.?版本的R,但是依赖包的问题解决较为麻烦,且后续容易出现各种问题,不建议安装。

 

SparkR安装的更多相关文章

  1. CentOS下SparkR安装部署:hadoop2.7.3+spark2.0.0+scale2.11.8+hive2.1.0

    注:之前本人写了一篇SparkR的安装部署文章:SparkR安装部署及数据分析实例,当时SparkR项目还没正式入主Spark,需要自己下载SparkR安装包,但现在spark已经支持R接口,so更新 ...

  2. SparkR安装部署及数据分析实例

    1. SparkR的安装配置 1.1.       R与Rstudio的安装 1.1.1.           R的安装 我们的工作环境都是在Ubuntu下操作的,所以只介绍Ubuntu下安装R的方法 ...

  3. 在CentOS上安装并运行SparkR

    环境配置—— 操作系统:CentOS 6.5 JDK版本:1.7.0_67 Hadoop集群版本:CDH 5.3.0 安装过程—— 1.安装R yum install -y R 2.安装curl-de ...

  4. Apache Spark技术实战之5 -- SparkR的安装及使用

    欢迎转载,转载请注明出处,徽沪一郎. 概要 根据论坛上的信息,在Sparkrelease计划中,在Spark 1.3中有将SparkR纳入到发行版的可能.本文就提前展示一下如何安装及使用SparkR. ...

  5. R︱sparkR的安装与使用、函数尝试笔记、一些案例

    本节内容转载于博客: wa2003 spark是一个我迟早要攻克的内容呀~ ------------------------------------- 一.SparkR 1.4.0 的安装及使用 1. ...

  6. sparkR介绍及安装

    sparkR介绍及安装 SparkR是AMPLab发布的一个R开发包,为Apache Spark提供了轻量的前端.SparkR提供了Spark中弹性分布式数据集(RDD)的API,用户可以在集群上通过 ...

  7. Spark in action Spark 以及SparkR的安装配置说明

    Spark以及SparkR的安装(standalone模式) From :ssdutsu @ Inspur Company  suzhiyuan2006@gmail.com 操作系统 CentOS 7 ...

  8. sparkR读取csv文件

    sparkR读取csv文件 The general method for creating SparkDataFrames from data sources is read.df. This met ...

  9. shiny server SparkR web展示界面(二)

    1.  需要先在Mac OS中安装好R,Rstudio中,这个比较简单,掠过 2. 下载编译好的spark(spark-2.0.0-bin-hadoop2.6.tgz)可以在Spark官网下载到你所需 ...

随机推荐

  1. vim学习之以退为进——可反复移动和可反复改动的美妙结合

    时间:2014.06.29 地点:基地 -------------------------------------------------------------------------------- ...

  2. 有关Option.inSamplSize 和 Compress 图片压缩

    1.图片占用内存:占用的内存 = 图片长度 * 图片宽度 * 单位像素占用的字节数 注: 图片长度和图片宽度就是图片在行列上的像素数量. 图片格式: ALPHA_8:表示8位Alpha位图,即A=8, ...

  3. SPOJ1811 LCS SAM

    后缀自动机简单题. 其主要思路是,先对第一个字符串建立后缀自动机,把第二个串放在上面匹配, 若当前状态s有字符x的转移,直接转移len=step+1. 若当前状态s没有向字符x的转移,退回pres检查 ...

  4. ALSA lib调用实例

    1. Display Some PCM Types and Formats 2. Opening PCM Device and Setting Parameters /* This example o ...

  5. UEFI启动模式下安装Ubuntu 16.04教程【转】

    本文转载自:http://blog.csdn.net/Jesse_Mx/article/details/61425361 前言 最近常帮人安装Ubuntu,也算积累了一些经验.这篇博文主要谈一谈如何在 ...

  6. SpringMVC ajax技术无刷新文件上传下载删除示例

    参考 Spring MVC中上传文件实例 SpringMVC结合ajaxfileupload.js实现ajax无刷新文件上传 Spring MVC 文件上传下载 (FileOperateUtil.ja ...

  7. JavaScript中浮点数的保留小数位数的问题

    方法一 简介:如题! 繁琐版... 代码如下: var significantFigure= function(value,figure){                 var arr=(valu ...

  8. 自定义标签(客户化jsp标签)

    客户化jsp标签技术是在jsp1.1版本中才出现的,他支持用户在jsp文件中自定义标签,这样可以使jsp代码更加简单,这些可重用的标签能够处理复杂的逻辑运算和事物或定义jsp网页的输出内容和格式. 创 ...

  9. CodeForces960F:Pathwalks (主席树+DP)

    You are given a directed graph with n nodes and m edges, with all edges having a certain weight. The ...

  10. Spring Boot配置多个DataSource

    使用Spring Boot时,默认情况下,配置DataSource非常容易.Spring Boot会自动为我们配置好一个DataSource. 百牛信息技术bainiu.ltd整理发布于博客园 如果在 ...