SparkR安装
一、在虚拟机中安装R语言
1.下载R语言压缩包R-3.2.2.tar.gz,放在目标目录下
★在此特别提醒,尽量安装3.2.?版本的R,更高版本的R容易出现依赖包安装不全的问题。
# mv R-3.2.2.tar.gz /home/hadoop
下载R语言压缩包建议采用以下两种方式:
一是在本机上使用浏览器下载好R语言的压缩包,再通过WinSCPPortable工具再发送到虚拟机。
二是直接在虚拟机中下载,使用命令#wget https://cran.r-project.org/src/base/R-3/R-3.2.2.tar.gz下载R语言压缩包。
2.将压缩包解压缩
# tar -zxf R-3.2.2.tar.gz
3.安装R语言依赖包
R语言运行依赖相关程序包,可以通过root身份进行安装。
安装R语言依赖包需要联网进行,所以在进行此步之前要先实现虚拟机的网络连接。
#yum install gcc -y
#yum install gcc-c++ -y
#yum install gcc-gfortran -y
#yum install readline-devel -y
#yum install libXt-devel -y
#yum install libpng-devel -y
4.编译安装
使用makr方法对R语言进行编译安装。
#cd /home/hadoop/R-3.2.2
#./configure --enable-R-shlib --with-x --with-libpng --with-jpeglib
#make && make install
5.检测R是否安装成功
使用命令行R进入R的编译模式并检测R是否安装成功。
出现如上界面说明R语言安装成功。
二、安装SparkR运行环境
1.安装依赖包
以root身份安装SparkR依赖包。
#yum install libcurl-devel -y
#yum install openssl-devel -y
#yum install libxml2-devel -y
2.在R Shell中安装相关依赖包
在安装依赖包时,会提示选择最佳的镜像站点,可以根据需要选择。
#R
>install.packages("rJava")
>install.packages("devtools")
>install.packages("git2r)
>install.packages("xml2")
>install.packages("rversions")
由于后续实例中需要画图,需要加入png、jpeg等支持,所以还需安装如下依赖包。
>install.packages("png")
>install.packages("jpeg")
三、安装SparkR
在某一版本后的Spark中,已经内置了SparkR,直接调用就可以了。
在此,安装的是Spark1.6.3。
四、启动并验证安装
首先启动R shell,然后加载SparkR。
#R
>library(SparkR)
报错及解决方法:
1. 编译R语言时
解决方法:yum install readline-devel
2. 下载依赖包时提示
解决方法:出现如上提示通常是网络问题
使用NAT方式进行网络连接,共享主机的网络。特别需要提醒的是,虚拟机中节点的网关和DNS问题。
在此处GATEWAY的最后一位不是1而是2。同时要确保虚拟机的DNS和主机的DNS一样。
3.编译R语言时报错
这个问题简单来说,就是从16年开始,R的新版本去除了一些原来包含在安装包里的包,并默认这些包已经安装在你的系统里,这时候,如果你用的是自己本地较新的linux/mac/windows版本,默认已经装好这些包,即使没有也能够很快安装或者更新这些包。但是,如果你是在服务器集群上,没有管理员权限,需要将这些包先安装在自己的目录下,然后才能调用,而关键的问题就是调用时的环境变量如何设置。
解决方法:安装较低版本的R语言,建议安装R-3.2.?版本的R,不容易出错。也可安装R-3.3.?版本的R,但是依赖包的问题解决较为麻烦,且后续容易出现各种问题,不建议安装。
SparkR安装的更多相关文章
- CentOS下SparkR安装部署:hadoop2.7.3+spark2.0.0+scale2.11.8+hive2.1.0
注:之前本人写了一篇SparkR的安装部署文章:SparkR安装部署及数据分析实例,当时SparkR项目还没正式入主Spark,需要自己下载SparkR安装包,但现在spark已经支持R接口,so更新 ...
- SparkR安装部署及数据分析实例
1. SparkR的安装配置 1.1. R与Rstudio的安装 1.1.1. R的安装 我们的工作环境都是在Ubuntu下操作的,所以只介绍Ubuntu下安装R的方法 ...
- 在CentOS上安装并运行SparkR
环境配置—— 操作系统:CentOS 6.5 JDK版本:1.7.0_67 Hadoop集群版本:CDH 5.3.0 安装过程—— 1.安装R yum install -y R 2.安装curl-de ...
- Apache Spark技术实战之5 -- SparkR的安装及使用
欢迎转载,转载请注明出处,徽沪一郎. 概要 根据论坛上的信息,在Sparkrelease计划中,在Spark 1.3中有将SparkR纳入到发行版的可能.本文就提前展示一下如何安装及使用SparkR. ...
- R︱sparkR的安装与使用、函数尝试笔记、一些案例
本节内容转载于博客: wa2003 spark是一个我迟早要攻克的内容呀~ ------------------------------------- 一.SparkR 1.4.0 的安装及使用 1. ...
- sparkR介绍及安装
sparkR介绍及安装 SparkR是AMPLab发布的一个R开发包,为Apache Spark提供了轻量的前端.SparkR提供了Spark中弹性分布式数据集(RDD)的API,用户可以在集群上通过 ...
- Spark in action Spark 以及SparkR的安装配置说明
Spark以及SparkR的安装(standalone模式) From :ssdutsu @ Inspur Company suzhiyuan2006@gmail.com 操作系统 CentOS 7 ...
- sparkR读取csv文件
sparkR读取csv文件 The general method for creating SparkDataFrames from data sources is read.df. This met ...
- shiny server SparkR web展示界面(二)
1. 需要先在Mac OS中安装好R,Rstudio中,这个比较简单,掠过 2. 下载编译好的spark(spark-2.0.0-bin-hadoop2.6.tgz)可以在Spark官网下载到你所需 ...
随机推荐
- ArcGIS10和ArcGIS10.1关于AO Licence初始化的问题
两个版本主要是esriLicenseProductCode.esriLicenseProductCodeArcInfo和esriLicenseProductCode.esriLicenseProduc ...
- Debug 和 Release 的区别
Debug 和 Release 的区别 Debug 通常称为调试版本,它包含调试信息,并且不作任何优化,便于程序员调试程序.Release 称为发布版本,它往往是进行了各种优化,使得程 ...
- 20170313 ABAP以jason 格式返回值到http(接口内容返回)
问题1: 返回jason 格式信息给你们这步不通, 这个可以怎么处理, ***得到SCP 系统开发回复,他们需要调整方法: (1)调用函数做RETURN, IT_ZSMLSCPNOTICE-FUNC ...
- DTLS学习笔记 -- RFC 4347- 6347
想学习一下dtls,是因为想以后没有公司免费VPN可用的时候,我能买一个主机,自己建一个VPN. 1.介绍 Web, email大多用TLS协议来做安全的网络传输,它们必须跑在可靠的TCP传输通道里. ...
- 基于sys文件系统的LED驱动的移植【原创】
基于RK3188平台LED驱动程序的移植的移植.如有不正确之处,欢迎大家指点. 本文的LED驱动程序不是通过打开设备节点来访问和控制LED的,是通过sys文件系统来控制LED. 板子上有四盏灯以及对应 ...
- "未预编译文件 因此不能请求该文件"问题处理
手里一个项目重新编译后发布,访问时提示未预编译文件“default.aspx”, 因此不能请求该文件.综合网上的解决方法,做了如下操作: 1.重新安装了AJAX Extension: 2.项目添加引用 ...
- java 基于百度地图API GPS经纬度解析地址
首先这是百度地图api 的接口地址,基于接口的参数,不过多介绍,其中都提供相应的介绍: http://lbsyun.baidu.com/index.php?title=webapi/guide/web ...
- coeforces 665D D. Simple Subset(最大团orsb题)
题目链接: D. Simple Subset time limit per test 1 second memory limit per test 256 megabytes input standa ...
- Codeforces Round #535(div 3) 简要题解
Problem A. Two distinct points [题解] 显然 , 当l1不等于r2时 , (l1 , r2)是一组解 否则 , (l1 , l2)是一组合法的解 时间复杂度 : O(1 ...
- Tensorboard 的简单使用
确保环境以及安装好tensorflow以及tensorboard 下面通过一个简单的例子来显示一下使用方式,一个向量加法的图结构. import tensorflow as tf a = tf.con ...