本文的配置环境是VMware10+centos2.5。

在学习大数据过程中,首先是要搭建环境,通过实验,在这里简短粘贴书写关于自己搭建大数据伪分布式环境的经验。

如果感觉有问题,欢迎咨询评论。

一:伪分布式准备工作

1.规划目录

  

2.修改目录所有者和所属组

  

3.删除原有的jdk

  

4.上传需要的jdk包

 

5.增加jdk 的执行权限

  

6.解压jdk

  

7.修改profile的JAVA_HOME,PATH

  

8.切换至root用户,使文件生效

  

9.检验jdk是否成功

  

二:搭建为分布式

1.解压hadoop

  

2.进入hadoop主目录

  

3.获取JAVA_HOME的目录

  

4.修改hadoop-env.sh的JAVA_HOME

  

5.修改mapred-env.h的JAVA_HOME

  

6.修改yarn-env.sh的JAVA_HOME

  

7.配置core-site.xml

  

8.修改slave的配置

  

9.修改hdfs.site.xml

  

10.检验hdfs

  

11.格式化hdfs

  

  

12.启动namenode 以及datanode进程

  

13.查看浏览器,方便管理HDFS

  

14.在HDFS上新建文件夹

  

   

15.在HDFS上上传文件

  

   

16.在HDFS上读取wenjian

  

17.在HDFS上下载文件到本地

  

18.配置yarn-site.xml

  

19.启动resourcemanager与nodemanager

  

20.在浏览器上运行yarn,方便管理

  

21.配置MapReduce的配置,MapReduce.site.xml

  表示mapreduce将要运行在yarn上

  

22.新建将要测试的文件

  

  

23.在HDFS上新建文件目录

  

  

24.上传本地的wc.input文件进刚刚新建的目录

   

  

25.在yarn上运行计算

  

   

26.查看结果

  

  

  

三:细节  

1.配置历史服务器,修改mapred-xite.xml

  

2.启动服务器

  

3.建议历史服务器在yarn启动之后紧接着启动,这样就可以看到二.26的结果

4.日志聚集功能,修改yarn.site.xml

  

5.重新启动resourcemanager,nodemanager,jobhistory

  

6.再次在yarn上运行程序

  

7.这时就可以点击logs,在yarn的管理页面上观看日志文件

  

8.logs点击的结果

  

9.HDFS用户权限的修改,点击tmp时,出现的问题效果

  

10.修改hdfs.xite.xml,使hdfs不在检查用户权限

  

11.重新启动HDFS

  

12.再次点击tmp,即可进入

  

13.修改静态用户名,之前的状态

  

14.修改core.site.xml

  

15.重启HDFS和YARN

  

16.重启任务

  

17.这时静态用户将会变成设置的用户

  

  

 

linux环境下的伪分布式环境搭建的更多相关文章

  1. 007 linux环境下的伪分布式环境搭建

    本文的配置环境是VMware10+centos2.5. 在学习大数据过程中,首先是要搭建环境,通过实验,在这里简短粘贴书写关于自己搭建大数据伪分布式环境的经验. 如果感觉有问题,欢迎咨询评论. 零:下 ...

  2. CentOS7下Hadoop伪分布式环境搭建

    CentOS7下Hadoop伪分布式环境搭建 前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...

  3. Linux单机环境下HDFS伪分布式集群安装操作步骤v1.0

    公司平台的分布式文件系统基于Hadoop HDFS技术构建,为开发人员学习及后续项目中Hadoop HDFS相关操作提供技术参考特编写此文档.本文档描述了Linux单机环境下Hadoop HDFS伪分 ...

  4. 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境

    近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...

  5. CentOS5.4 搭建Hadoop2.5.2伪分布式环境

    简介: Hadoop是处理大数据的主要工具,其核心部分是HDFS.MapReduce.为了学习的方便,我在虚拟机上搭建了一个伪分布式环境,来进行开发学习. 一.安装前准备: 1)linux服务器:Vm ...

  6. Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境

    引言 一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...

  7. 《OD大数据实战》Hadoop伪分布式环境搭建

    一.安装并配置Linux 8. 使用当前root用户创建文件夹,并给/opt/下的所有文件夹及文件赋予775权限,修改用户组为当前用户 mkdir -p /opt/modules mkdir -p / ...

  8. OS X Yosemite下安装Hadoop2.5.1伪分布式环境

    最近开始学习Hadoop,一直使用的是公司配好的环境.用了一段时间后发现对Hadoop还是一知半解,故决定动手在本机上安装一个供学习研究使用.正好自己用的是mac,所以没啥说的,直接安装. 总体流程 ...

  9. Hadoop2.5.0伪分布式环境搭建

    本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...

随机推荐

  1. BZOJ3547 : [ONTAK2010]Matchings

    树形DP f[i][0]表示不向下连边的最大匹配数 f[i][1]表示向下连一条边的最大匹配数 h[][]表示对应的方案数 为了防止爆栈用BFS 为了防止MLE: 1.数组循环利用,比如存边的数组在存 ...

  2. wp7 HubTile

    在最新的Windows Phone Toolkit中我们可以看到HubTile这个控件,首先先了解下什么是HubTile,简单来说,就是允许你给你的应用程序添加些生动或富有意义的瓦片(Tile).Hu ...

  3. TYVJ P1091 等差数列 Label:dp

    背景 广东汕头聿怀初中 Train#3 Problem 3 描述 等差数列的定义是一个数列S,它满足了(S[i]-S[i-1]) = d (i>1).显然的一个单独的数字或者两个数字也可以形成一 ...

  4. ubuntu apt源

    deb http://archive.ubuntu.com/ubuntu/ vivid main restricted universe multiversedeb http://archive.ub ...

  5. dpi 、 dip 、分辨率、屏幕尺寸、px、density 关系以及换算(终结版)

    首先,说下概念(网上很多帖子几个地方都搞混了,理一下):   dip : device independent pixels ,设备无关像素. 我看很多帖子写的五花八门的,关于d的,什么display ...

  6. 什么是SQL注入式攻击

    什么是SQL注入式攻击? 所谓SQL注入式攻击,就是攻击者把SQL命令插入到Web表单的输入域或页面请求的查询字符串,欺骗服务器执行恶意的SQL命令.在某些表单中,用户输入的内容直接用来构造(或者影响 ...

  7. python基础数据类型

    整形:(不可变类型) >>> a = 123>>> type(a)<class 'int'> 长整形:(在python3中已经废弃了) >> ...

  8. 让input不可编辑的方法

    两种方法: disabled="true " 文字会变成灰色,不可编辑. readOnly="true" 文字不会变色,也是不可编辑的 <input na ...

  9. sql语句清除mssql日志

    DUMP TRANSACTION TestDB WITH NO_LOG 清除日志 DBCC SHRINKFILE ('TestDB_log',1) 收缩数据库文件            -----直接 ...

  10. bootstrap-table 原来bootstrap还有这么强大的表格插件

    http://issues.wenzhixin.net.cn/bootstrap-table/index.html