原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html

本文基于CentOS6.4系统介绍基于RHadoop平台的搭建,Hadoop的搭建可以参考http://www.cnblogs.com/tovin/p/3818908.html,以下着重介绍在Hadoop平台上构建R

一、安装R

  (1)安装依赖软件

    sudo yum install gcc-gfortran

    sudo yum install gcc gcc-c++

    sudo yum install readline-devel

    sudo yum install libXt-devel

  (2)安装R包

    cd /home/hdp/download  

    wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.1.0.tar.gz

    tar zxvf R-3.1.0.tar.gz

    cd R-3.1.0

    ./configure --enable-R-shlib

    sudo make

    sudo make install

    把R、Rscript加入环境变量

    sudo ln -s /usr/local/bin/Rscript /usr/bin/Rscript

    sudo ln -s /usr/local/bin/R /usr/bin/R

  在linux终端输入R,如果启动正常则表明安装成功

  

二、安装RStudio

  为了更方便把RHadoop提供给开发人员使用,可以使用基于Web操作的RStudio来操作R

  cd /home/hdp/download  

  wget http://download2.rstudio.org/rstudio-server-0.98.953-x86_64.rpm

  sudo yum install libcrypto.so.6

  sudo yum install libgfortran.so.1

  sudo yum install libssl.so.6

  sudo yum install openssl098e-0.9.8e

  sudo yum install gcc41-libgfortran-4.1.2

  sudo yum install pango-1.28.1

  sudo yum install compat-libgfortran

  cd /etc/ld.so.conf.d/

  sudo vim rstudio.conf添加内容

    /usr/local/lib64/R/lib
  再执行sudo ldconfig将下面几个so库加入系统库

  

  sudo rpm -Uvh --nodeps rstudio-server-0.98.953-x86_64.rpm  

  至此rstudio安装完成并启动,运行rstudio-server verify-installation看是否会报错

  最后,可以进入/etc/rstudio目录修改rserver.conf配置文件添加登录权限管理

  

  auth-required-usr-group是针对设置的组才能登录系统。注意:rstudio用户是和linux本地帐号一致的,对于ldap用户是不支持的。

  访问8787端口就能进入rstudio web界面了:

    

三、安装RHadoop 

  1、下载rmr、rhdfs

         进入https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads下载rmr、rhdfs包

  2、安装rmr、rhdfs

    cmd执行命令行执行:
  

      R CMD javareconf
  

    启动R执行:

      install.packages("rJava")

      install.packages("reshape2")

      install.packages("Rcpp")

      install.packages("iterators")

      install.packages("itertools")

      install.packages("digest")

      install.packages("RJSONIO")

      install.packages("functional")

    cmd执行命令行执行:

    R CMD INSTALL rhdfs-1.0.8.tar.gz

    R CMD INSTALL rmr-3.1.2.tar.gz

  3、修改环境变量

   cd /usr/local/lib64/R/etc

   修改Renviron文件增加HADOOP_CMD、HADOOP_STREAMING环境变量,这步很关键不然RStudio会报错获取不到HADOOP环境变量

   

 4、部署DataNode

   将/usr/local/lib64/R目录下所有文件传至所有DataNode节点相同位置

   sudo cp /usr/local/lib64/R/bin/R /usr/local/bin/

     sudo cp /usr/local/lib64/R/bin/Rscript /usr/local/bin/ 

    至此完成了RHadoop平台部署 

四、测试验证

  访问Rstudio web验证一下rhdfs、rmr2的功能

  1、hdfs功能验证

    

  2、mapreduce功能验证

    

    

    安装部署成功,收工!

 原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html

RHadoop计算平台搭建的更多相关文章

  1. 从零构建Flink SQL计算平台 - 1平台搭建

    一.理想与现实 Apache Flink 是一个分布式流批一体化的开源平台.Flink 的核心是一个提供数据分发.通信以及自动容错的流计算引擎.Flink 在流计算之上构建批处理,并且原生的支持迭代计 ...

  2. Storm on Yarn :原理分析+平台搭建

    Storm on YARN: Storm on YARN被视为大规模Web应用与传统企业应用之间的桥梁.它将Storm事件处理平台与YARN(Yet Another Resource Negotiat ...

  3. 大数据平台搭建-zookeeper集群的搭建

    本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

  4. 大数据平台搭建-kafka集群的搭建

    本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

  5. 携程实时计算平台架构与实践丨DataPipeline

    文 | 潘国庆 携程大数据平台实时计算平台负责人 本文主要从携程大数据平台概况.架构设计及实现.在实现当中踩坑及填坑的过程.实时计算领域详细的应用场景,以及未来规划五个方面阐述携程实时计算平台架构与实 ...

  6. 克拉克拉(KilaKila):大规模实时计算平台架构实战

    克拉克拉(KilaKila):大规模实时计算平台架构实战 一.产品背景:克拉克拉(KilaKila)是国内专注二次元.主打年轻用户的娱乐互动内容社区软件.KilaKila推出互动语音直播.短视频配音. ...

  7. 手把手教您将 libreoffice 移植到函数计算平台

    LibreOffice 是由文档基金会开发的自由及开放源代码的办公室套件.LibreOffice 套件包含文字处理器.电子表格.演示文稿程序.矢量图形编辑器和图表工具.数据库管理程序及创建和编辑数学公 ...

  8. 大数据计算平台Spark内核全面解读

    1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着Spark在大数据计算领域的暂露头角,越来越多的 ...

  9. 一个简单的使用Quartz和Oozie调度作业给大数据计算平台执行

    一,介绍 Oozie是一个基于Hadoop的工作流调度器,它可以通过Oozie Client 以编程的形式提交不同类型的作业,如MapReduce作业和Spark作业给底层的计算平台(如 Cloude ...

随机推荐

  1. MongoDB 数据类型

    MongoDB支持许多数据类型的列表下面给出: String : 这是最常用的数据类型来存储数据.在MongoDB中的字符串必须是有效的UTF-8. Integer : 这种类型是用来存储一个数值.整 ...

  2. [转]coredump简介与coredump原因总结

    [转]coredump简介与coredump原因总结 http://blog.sina.com.cn/s/blog_54f82cc201013srb.html 什么是coredump? 通常情况下co ...

  3. Java实现Tire

    Trie,又称单词查找树或键树,是一种树形结构.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是:最大限度地减少无谓的字符串比较,查询效率比 ...

  4. PHP错误The server encountered an internal error or misconfiguration and was unable to complete your re

    我的笔记本电脑上的环境安装了很多次,但是运行项目时总是会报The server encountered an internal error or misconfiguration and was un ...

  5. 不会JS中的OOP,你也太菜了吧!(第二篇)

    一.你必须知道的 1> 原型及原型链在继承中起到了关键的作用.所以你一定要理解他们.2> 不会JS中的OOP,你也太菜了吧!(第一篇) 二.继承的6种方法 1> 原型链继承 原型链继 ...

  6. 《JavaScript高级程序设计》第6章 面向对象程序设计

    6.1 对象属性 6.1.1 属性类型 1. 数据属性 我们一般所说的属性就是数据属性,它用来将一个字符串名称映射到某个值上 数据属性的4个特性: configurable, enumerable, ...

  7. 【BZOJ】【1798】【AHOI2009】Seq维护序列

    线段树 属于线段树中级应用吧…… 要打两种标记:乘法和加法标记.一开始我想着可以像只有加法标记那样,永不下传,查询的时候依次累加就好了.后来发现不会写……只好每次update的时候……遇到标记!下传! ...

  8. ubuntu1404_server搭建lamp

    ubuntu server版可直接一键安装lamp环境 apt-get install lamp-server^ 根据提示输入所需设置密码即可,其配置文件跟编译安装的apached等区别很大 apac ...

  9. 图片放大镜插件 Cloud Zoom v3.1

    Cloud Zoom是一个图像放大jQuery插件,效果堪比Magic Zoom.相对于流行jQZoom插件,Cloud Zoom体积小,有更多的功能和更强大的跨浏览器兼容性. 猛击这里查看演示DEM ...

  10. Java递归列出目录下全部文件

    Java递归列出目录下全部文件 /** * 列出指定目录的全部内容 * */ import java.io.*; class hello{ public static void main(String ...