RHadoop计算平台搭建
原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html
本文基于CentOS6.4系统介绍基于RHadoop平台的搭建,Hadoop的搭建可以参考http://www.cnblogs.com/tovin/p/3818908.html,以下着重介绍在Hadoop平台上构建R
一、安装R
(1)安装依赖软件
sudo yum install gcc-gfortran
sudo yum install gcc gcc-c++
sudo yum install readline-devel
sudo yum install libXt-devel
(2)安装R包
cd /home/hdp/download
wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.1.0.tar.gz
tar zxvf R-3.1.0.tar.gz
cd R-3.1.0
./configure --enable-R-shlib
sudo make
sudo make install
把R、Rscript加入环境变量
sudo ln -s /usr/local/bin/Rscript /usr/bin/Rscript
sudo ln -s /usr/local/bin/R /usr/bin/R
在linux终端输入R,如果启动正常则表明安装成功
二、安装RStudio
为了更方便把RHadoop提供给开发人员使用,可以使用基于Web操作的RStudio来操作R
cd /home/hdp/download
wget http://download2.rstudio.org/rstudio-server-0.98.953-x86_64.rpm
sudo yum install libcrypto.so.6
sudo yum install libgfortran.so.1
sudo yum install libssl.so.6
sudo yum install openssl098e-0.9.8e
sudo yum install gcc41-libgfortran-4.1.2
sudo yum install pango-1.28.1
sudo yum install compat-libgfortran
cd /etc/ld.so.conf.d/
sudo vim rstudio.conf添加内容
/usr/local/lib64/R/lib
再执行sudo ldconfig将下面几个so库加入系统库
sudo rpm -Uvh --nodeps rstudio-server-0.98.953-x86_64.rpm
至此rstudio安装完成并启动,运行rstudio-server verify-installation看是否会报错
最后,可以进入/etc/rstudio目录修改rserver.conf配置文件添加登录权限管理
auth-required-usr-group是针对设置的组才能登录系统。注意:rstudio用户是和linux本地帐号一致的,对于ldap用户是不支持的。
访问8787端口就能进入rstudio web界面了:
三、安装RHadoop
1、下载rmr、rhdfs
进入https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads下载rmr、rhdfs包
2、安装rmr、rhdfs
cmd执行命令行执行:
R CMD javareconf
启动R执行:
install.packages("rJava")
install.packages("reshape2")
install.packages("Rcpp")
install.packages("iterators")
install.packages("itertools")
install.packages("digest")
install.packages("RJSONIO")
install.packages("functional")
cmd执行命令行执行:
R CMD INSTALL rhdfs-1.0.8.tar.gz
R CMD INSTALL rmr-3.1.2.tar.gz
3、修改环境变量
cd /usr/local/lib64/R/etc
修改Renviron文件增加HADOOP_CMD、HADOOP_STREAMING环境变量,这步很关键不然RStudio会报错获取不到HADOOP环境变量
4、部署DataNode
将/usr/local/lib64/R目录下所有文件传至所有DataNode节点相同位置
sudo cp /usr/local/lib64/R/bin/R /usr/local/bin/
sudo cp /usr/local/lib64/R/bin/Rscript /usr/local/bin/
至此完成了RHadoop平台部署
四、测试验证
访问Rstudio web验证一下rhdfs、rmr2的功能
1、hdfs功能验证
2、mapreduce功能验证
安装部署成功,收工!
原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html
RHadoop计算平台搭建的更多相关文章
- 从零构建Flink SQL计算平台 - 1平台搭建
一.理想与现实 Apache Flink 是一个分布式流批一体化的开源平台.Flink 的核心是一个提供数据分发.通信以及自动容错的流计算引擎.Flink 在流计算之上构建批处理,并且原生的支持迭代计 ...
- Storm on Yarn :原理分析+平台搭建
Storm on YARN: Storm on YARN被视为大规模Web应用与传统企业应用之间的桥梁.它将Storm事件处理平台与YARN(Yet Another Resource Negotiat ...
- 大数据平台搭建-zookeeper集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
- 大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
- 携程实时计算平台架构与实践丨DataPipeline
文 | 潘国庆 携程大数据平台实时计算平台负责人 本文主要从携程大数据平台概况.架构设计及实现.在实现当中踩坑及填坑的过程.实时计算领域详细的应用场景,以及未来规划五个方面阐述携程实时计算平台架构与实 ...
- 克拉克拉(KilaKila):大规模实时计算平台架构实战
克拉克拉(KilaKila):大规模实时计算平台架构实战 一.产品背景:克拉克拉(KilaKila)是国内专注二次元.主打年轻用户的娱乐互动内容社区软件.KilaKila推出互动语音直播.短视频配音. ...
- 手把手教您将 libreoffice 移植到函数计算平台
LibreOffice 是由文档基金会开发的自由及开放源代码的办公室套件.LibreOffice 套件包含文字处理器.电子表格.演示文稿程序.矢量图形编辑器和图表工具.数据库管理程序及创建和编辑数学公 ...
- 大数据计算平台Spark内核全面解读
1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着Spark在大数据计算领域的暂露头角,越来越多的 ...
- 一个简单的使用Quartz和Oozie调度作业给大数据计算平台执行
一,介绍 Oozie是一个基于Hadoop的工作流调度器,它可以通过Oozie Client 以编程的形式提交不同类型的作业,如MapReduce作业和Spark作业给底层的计算平台(如 Cloude ...
随机推荐
- iOS学习之C语言函数
一.函数的定义 返回值类型 函数名(参数类型 参数名, ...) { 功能语句; return 返回值; } 按照返回值和参数划分: 第一种: 无返回值 无参 void sayHello() { pr ...
- linq里的select和selectmany操作
Select() 和 SelectMany() 的工作都是依据源值生成一个或多个结果值.Select() 为每个源值生成一个结果值.因此,总体结果是一个与源集合具有相同元素数目的集合.与之相反,Sel ...
- Python实现nb(朴素贝叶斯)
Python实现nb(朴素贝叶斯) 运行环境 Pyhton3 numpy科学计算模块 计算过程 st=>start: 开始 op1=>operation: 读入数据 op2=>ope ...
- InputStream和OutputStream与String之间的转换
//1.字符串转inputstream String str="aaaaa"; InputStream in = new ByteArrayInputStream(str.getB ...
- android 开发对gif解码(适配android 4.2、4.3、4.4版本)
android 开发对gif解码(适配android 4.2.4.3.4.4版本) 使用方法: public class ImageInputActivity extends Activity imp ...
- Netsharp快速入门(之3) 基础档案(之B 实体建模 新建项目)
作者:秋时 杨昶 时间:2014-02-15 转载须说明出处 3.3 创建业务模型 3.3.1 新建项目 1.打开业务模型 2.打开业务模型后,在工具栏上选择操作-新增项目分类,标识这 ...
- 基于AutoCAD的空间数据共享平台雏形
好久没有更新博客了,今天先透露一个新的产品——AutoMap.我自己对于这个产品的定位是“基于AutoCAD的空间数据共享平台”.用一句话来概括AutoMap的功能:为用户提供一个在AutoCAD下访 ...
- 了解javascript中的事件(二)
本文目录如下: 零.寒暄 一.事件的分类 二.事件代理 2.1 问题引出 2.2 什么是事件代理 2.3 完整示例 二.事件代理 三.事件代理思想的用处 四.总结 零.寒暄 这篇博客本该出现在两个月以 ...
- Lua require搜索路径指定方法
在自己的lua文件中,如果使用到了自己写的C库或者第三方库,想让lua编译到自己指定的目录下寻找*.lua或*.so文件的时候,可以再自己的Lua代码中添加如下代码,可以指定require搜索的路径. ...
- [转]layoutSubviews总结
原文链接找不到了,转的时候别人也是转载的,但并未留下原创链接,就当是笔记了. ios layout机制相关方法 - (CGSize)sizeThatFits:(CGSize)size- (void)s ...