本文的配置环境是VMware10+centos2.5。

在学习大数据过程中,首先是要搭建环境,通过实验,在这里简短粘贴书写关于自己搭建大数据伪分布式环境的经验。

如果感觉有问题,欢迎咨询评论。

一:伪分布式准备工作

1.规划目录

  

2.修改目录所有者和所属组

  

3.删除原有的jdk

  

4.上传需要的jdk包

 

5.增加jdk 的执行权限

  

6.解压jdk

  

7.修改profile的JAVA_HOME,PATH

  

8.切换至root用户,使文件生效

  

9.检验jdk是否成功

  

二:搭建为分布式

1.解压hadoop

  

2.进入hadoop主目录

  

3.获取JAVA_HOME的目录

  

4.修改hadoop-env.sh的JAVA_HOME

  

5.修改mapred-env.h的JAVA_HOME

  

6.修改yarn-env.sh的JAVA_HOME

  

7.配置core-site.xml

  

8.修改slave的配置

  

9.修改hdfs.site.xml

  

10.检验hdfs

  

11.格式化hdfs

  

  

12.启动namenode 以及datanode进程

  

13.查看浏览器,方便管理HDFS

  

14.在HDFS上新建文件夹

  

   

15.在HDFS上上传文件

  

   

16.在HDFS上读取wenjian

  

17.在HDFS上下载文件到本地

  

18.配置yarn-site.xml

  

19.启动resourcemanager与nodemanager

  

20.在浏览器上运行yarn,方便管理

  

21.配置MapReduce的配置,MapReduce.site.xml

  表示mapreduce将要运行在yarn上

  

22.新建将要测试的文件

  

  

23.在HDFS上新建文件目录

  

  

24.上传本地的wc.input文件进刚刚新建的目录

   

  

25.在yarn上运行计算

  

   

26.查看结果

  

  

  

三:细节  

1.配置历史服务器,修改mapred-xite.xml

  

2.启动服务器

  

3.建议历史服务器在yarn启动之后紧接着启动,这样就可以看到二.26的结果

4.日志聚集功能,修改yarn.site.xml

  

5.重新启动resourcemanager,nodemanager,jobhistory

  

6.再次在yarn上运行程序

  

7.这时就可以点击logs,在yarn的管理页面上观看日志文件

  

8.logs点击的结果

  

9.HDFS用户权限的修改,点击tmp时,出现的问题效果

  

10.修改hdfs.xite.xml,使hdfs不在检查用户权限

  

11.重新启动HDFS

  

12.再次点击tmp,即可进入

  

13.修改静态用户名,之前的状态

  

14.修改core.site.xml

  

15.重启HDFS和YARN

  

16.重启任务

  

17.这时静态用户将会变成设置的用户

  

  

 

linux环境下的伪分布式环境搭建的更多相关文章

  1. 007 linux环境下的伪分布式环境搭建

    本文的配置环境是VMware10+centos2.5. 在学习大数据过程中,首先是要搭建环境,通过实验,在这里简短粘贴书写关于自己搭建大数据伪分布式环境的经验. 如果感觉有问题,欢迎咨询评论. 零:下 ...

  2. CentOS7下Hadoop伪分布式环境搭建

    CentOS7下Hadoop伪分布式环境搭建 前期准备 1.配置hostname(可选,了解) 在CentOS中,有三种定义的主机名:静态的(static),瞬态的(transient),和灵活的(p ...

  3. Linux单机环境下HDFS伪分布式集群安装操作步骤v1.0

    公司平台的分布式文件系统基于Hadoop HDFS技术构建,为开发人员学习及后续项目中Hadoop HDFS相关操作提供技术参考特编写此文档.本文档描述了Linux单机环境下Hadoop HDFS伪分 ...

  4. 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境

    近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...

  5. CentOS5.4 搭建Hadoop2.5.2伪分布式环境

    简介: Hadoop是处理大数据的主要工具,其核心部分是HDFS.MapReduce.为了学习的方便,我在虚拟机上搭建了一个伪分布式环境,来进行开发学习. 一.安装前准备: 1)linux服务器:Vm ...

  6. Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境

    引言 一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...

  7. 《OD大数据实战》Hadoop伪分布式环境搭建

    一.安装并配置Linux 8. 使用当前root用户创建文件夹,并给/opt/下的所有文件夹及文件赋予775权限,修改用户组为当前用户 mkdir -p /opt/modules mkdir -p / ...

  8. OS X Yosemite下安装Hadoop2.5.1伪分布式环境

    最近开始学习Hadoop,一直使用的是公司配好的环境.用了一段时间后发现对Hadoop还是一知半解,故决定动手在本机上安装一个供学习研究使用.正好自己用的是mac,所以没啥说的,直接安装. 总体流程 ...

  9. Hadoop2.5.0伪分布式环境搭建

    本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤.首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户.安装JDK.关闭防火墙等. 一.创建hadoo ...

随机推荐

  1. B 倒不了的塔

    Time Limit:1000MS  Memory Limit:65535K 题型: 编程题   语言: 无限制 描述 Dota是Defense of the Ancients的简称,是一个dhk和y ...

  2. MVC _ViewStart文件的作用

    指定目录下的所有文件均继承自 某个Layout. 支持最近原则. 参考:http://www.cnblogs.com/iamlilinfeng/archive/2013/02/28/2934397.h ...

  3. Revit二次开发示例:DisableCommand

    Revit API 不支持调用Revit内部命令,但可以用RevitCommandId重写它们(包含任意选项卡,菜单和右键命令).使用RevitCommandId.LookupCommandId()可 ...

  4. TC SRM 584 DIV 2

    第一次在DIV2 AK了. 250水题. 500,FLoyd搞出所有边的最短路,然后找最短路,中最长的,如果有不连通的边返回-1 1000,组合DP,各种慌乱,在最后1分钟时,交上了,感觉很棒,最后还 ...

  5. Graph database_neo4j 底层存储结构分析(4)

    3.3.2   DynamicStore 类型 3.3.2.1        AbstractDynamicStore 的存储格式 neo4j 中对于字符串等变长值的保存策略是用一组定长的 block ...

  6. Brief introduction to Scala and Breeze for statistical computing

    Brief introduction to Scala and Breeze for statistical computing 时间 2013-12-31 03:17:19  Darren Wilk ...

  7. TCP和UDP的135、137、138、139、445端口的作用

    如果全是2000以上的系统,可以关闭137.138.139,只保留445 如果有xp系统,可能以上四个端口全部要打开 无论你的服务器中安装的是Windows 2000 Server,还是Windows ...

  8. Unattend.xml应答文件制作(WISM)-- 转自爱做梦的鱼

    将制作好的应答文件unattend.xml拷贝到模板机sysprep目录下,然后在cmd下运行(unattend.xml文件可自定义名称)   sysprep /generalize /oobe /s ...

  9. WEB项目web.xml文件中classpath: 跟classpath*:使用的区别

    引用一篇很不错的文章:http://blog.csdn.net/wxwzy738/article/details/16983935 首先 classpath是指 WEB-INF文件夹下的classes ...

  10. [ZZ] KlayGE 游戏引擎 之 Order Independent Transparency(OIT)

    转载请注明出处为KlayGE游戏引擎,本文的永久链接为http://www.klayge.org/?p=2233 http://dogasshole.iteye.com/blog/1429665 ht ...