原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html

本文基于CentOS6.4系统介绍基于RHadoop平台的搭建,Hadoop的搭建可以参考http://www.cnblogs.com/tovin/p/3818908.html,以下着重介绍在Hadoop平台上构建R

一、安装R

  (1)安装依赖软件

    sudo yum install gcc-gfortran

    sudo yum install gcc gcc-c++

    sudo yum install readline-devel

    sudo yum install libXt-devel

  (2)安装R包

    cd /home/hdp/download  

    wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.1.0.tar.gz

    tar zxvf R-3.1.0.tar.gz

    cd R-3.1.0

    ./configure --enable-R-shlib

    sudo make

    sudo make install

    把R、Rscript加入环境变量

    sudo ln -s /usr/local/bin/Rscript /usr/bin/Rscript

    sudo ln -s /usr/local/bin/R /usr/bin/R

  在linux终端输入R,如果启动正常则表明安装成功

  

二、安装RStudio

  为了更方便把RHadoop提供给开发人员使用,可以使用基于Web操作的RStudio来操作R

  cd /home/hdp/download  

  wget http://download2.rstudio.org/rstudio-server-0.98.953-x86_64.rpm

  sudo yum install libcrypto.so.6

  sudo yum install libgfortran.so.1

  sudo yum install libssl.so.6

  sudo yum install openssl098e-0.9.8e

  sudo yum install gcc41-libgfortran-4.1.2

  sudo yum install pango-1.28.1

  sudo yum install compat-libgfortran

  cd /etc/ld.so.conf.d/

  sudo vim rstudio.conf添加内容

    /usr/local/lib64/R/lib
  再执行sudo ldconfig将下面几个so库加入系统库

  

  sudo rpm -Uvh --nodeps rstudio-server-0.98.953-x86_64.rpm  

  至此rstudio安装完成并启动,运行rstudio-server verify-installation看是否会报错

  最后,可以进入/etc/rstudio目录修改rserver.conf配置文件添加登录权限管理

  

  auth-required-usr-group是针对设置的组才能登录系统。注意:rstudio用户是和linux本地帐号一致的,对于ldap用户是不支持的。

  访问8787端口就能进入rstudio web界面了:

    

三、安装RHadoop 

  1、下载rmr、rhdfs

         进入https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads下载rmr、rhdfs包

  2、安装rmr、rhdfs

    cmd执行命令行执行:
  

      R CMD javareconf
  

    启动R执行:

      install.packages("rJava")

      install.packages("reshape2")

      install.packages("Rcpp")

      install.packages("iterators")

      install.packages("itertools")

      install.packages("digest")

      install.packages("RJSONIO")

      install.packages("functional")

    cmd执行命令行执行:

    R CMD INSTALL rhdfs-1.0.8.tar.gz

    R CMD INSTALL rmr-3.1.2.tar.gz

  3、修改环境变量

   cd /usr/local/lib64/R/etc

   修改Renviron文件增加HADOOP_CMD、HADOOP_STREAMING环境变量,这步很关键不然RStudio会报错获取不到HADOOP环境变量

   

 4、部署DataNode

   将/usr/local/lib64/R目录下所有文件传至所有DataNode节点相同位置

   sudo cp /usr/local/lib64/R/bin/R /usr/local/bin/

     sudo cp /usr/local/lib64/R/bin/Rscript /usr/local/bin/ 

    至此完成了RHadoop平台部署 

四、测试验证

  访问Rstudio web验证一下rhdfs、rmr2的功能

  1、hdfs功能验证

    

  2、mapreduce功能验证

    

    

    安装部署成功,收工!

 原创文章,转载请注明: 转载自www.cnblogs.com/tovin/p/3824554.html

RHadoop计算平台搭建的更多相关文章

  1. 从零构建Flink SQL计算平台 - 1平台搭建

    一.理想与现实 Apache Flink 是一个分布式流批一体化的开源平台.Flink 的核心是一个提供数据分发.通信以及自动容错的流计算引擎.Flink 在流计算之上构建批处理,并且原生的支持迭代计 ...

  2. Storm on Yarn :原理分析+平台搭建

    Storm on YARN: Storm on YARN被视为大规模Web应用与传统企业应用之间的桥梁.它将Storm事件处理平台与YARN(Yet Another Resource Negotiat ...

  3. 大数据平台搭建-zookeeper集群的搭建

    本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

  4. 大数据平台搭建-kafka集群的搭建

    本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

  5. 携程实时计算平台架构与实践丨DataPipeline

    文 | 潘国庆 携程大数据平台实时计算平台负责人 本文主要从携程大数据平台概况.架构设计及实现.在实现当中踩坑及填坑的过程.实时计算领域详细的应用场景,以及未来规划五个方面阐述携程实时计算平台架构与实 ...

  6. 克拉克拉(KilaKila):大规模实时计算平台架构实战

    克拉克拉(KilaKila):大规模实时计算平台架构实战 一.产品背景:克拉克拉(KilaKila)是国内专注二次元.主打年轻用户的娱乐互动内容社区软件.KilaKila推出互动语音直播.短视频配音. ...

  7. 手把手教您将 libreoffice 移植到函数计算平台

    LibreOffice 是由文档基金会开发的自由及开放源代码的办公室套件.LibreOffice 套件包含文字处理器.电子表格.演示文稿程序.矢量图形编辑器和图表工具.数据库管理程序及创建和编辑数学公 ...

  8. 大数据计算平台Spark内核全面解读

    1.Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目.随着Spark在大数据计算领域的暂露头角,越来越多的 ...

  9. 一个简单的使用Quartz和Oozie调度作业给大数据计算平台执行

    一,介绍 Oozie是一个基于Hadoop的工作流调度器,它可以通过Oozie Client 以编程的形式提交不同类型的作业,如MapReduce作业和Spark作业给底层的计算平台(如 Cloude ...

随机推荐

  1. 一位iOS教育类应用开发者是如何赚到60多万美元?

    注:伯乐在线12月19日在@程序员的那些事 微博推荐了此文的英文原文,非常感谢@dotSlash 的翻译.  转眼距我写<我如何在iOS教育类应用中赚到20万美元>这篇博文已经一年多了,它 ...

  2. asf与vga视频为何无法同步播放?我来给你解释!

    因为你的笔记本可以,所以你的台式机不可以,当然跟深刻的原因是,你的笔记本有什么特别硬件

  3. Labview实现脉波调制( PAM )

    Labview实现脉波调制( PAM ) 根据定义为脉冲振幅调制 生成一个正弦信号,得到其幅值输入给一个方波信号的幅值 这个等价于一个方波信号和一个正弦信号相乘 得到的PAM信号通过观察其频率可以发现 ...

  4. Liferay 7 portlet中所有能在@Component中修改的属性

    "com.liferay.portlet.action-timeout", "com.liferay.portlet.active", "com.li ...

  5. MVC缓存技术

    一.MVC缓存简介 缓存是将信息(数据或页面)放在内存中以避免频繁的数据库存储或执行整个页面的生命周期,直到缓存的信息过期或依赖变更才再次从数据库中读取数据或重新执行页面的生命周期.在系统优化过程中, ...

  6. httphelp web自动化

    public class HttpHelper    {        public static CookieContainer CookieContainers = new CookieConta ...

  7. Oracle 相关概念详解

    一.前言 笔者对于Oracle数据库的理解,很长时间停留在“镜花水月”的状态,你说不懂吧,又会用,一较真起来吧,对一些基本概念又说不出一个道道来~如果想要在编码的路上走得更远,这个必定也是绕不过的坎, ...

  8. 使用Npoi向Excel中插入图片

    先把数据库中的数据都导入到Excel表格中,把图片地址的路径全部转成绝对路径. 使用Npoi读取刚导出的Excle表格,把图片那个单元格的图片路径读出来,然后用文件流读取图片,然后通过Npoi把图片放 ...

  9. Leetcode#138 Copy List with Random Pointer

    原题地址 非常巧妙的方法,不需要用map,只需要O(1)的额外存储空间,分为3步: 1. 先复制链表,但是这个复制比较特殊,每个新复制的节点添加在原节点的后面,相当于"加塞"2. ...

  10. extjs4 与 kindeditor

    <link rel="stylesheet" href="<?php echo Yii::app()->request->baseUrl;?> ...