1.关于run on hadoop的问题:

在未用hadoop eclipse插件前,我以为通过hadoop eclipse 插件不但能够管理hdfs,还能够自己主动打包程序。并帮我自己主动设置Configuration对象的mapred.jar属性值。但用了之后,才发现,这个插件仅仅能管理hdfs。至于打包程序等操作,还得自己手动进行。

我用的hadoop 版本号为1.2.1,hadoop eclipse插件个人亲自编译生成,保证无不论什么问题,我一開始用的是MyEclipse后来换成Eclipse。但试用了,仍存在这个问题。

"run
as——>run on hadoop"并未弹出例如以下所看到的窗体:

而是直接执行了,效果跟"run as——>run configurations——>填写參数值——>run"的效果一致。

不知道是不是这个hadoop 1.2.1版本号的ecipse插件都存在这个问题,还是我个人使用出现的问题,假设有哪位童鞋们知道这个问题,能够赐教下!

2.关于通过ecipse设置hadoop执行模式的问题:

说先,我们要明白hadoop的执行模式以及各种执行模式的差别,參考例如以下:

 (1)独立模式<standalone>(也叫本地模式<local
mode>)
独立模式全然执行在本地。不会载入不论什么MapReduce服务,因而不会涉及Mapreduce最核心的代码实现。

独立模式无需执行不论什么守护进程(daemon),全部程序都在单个JVM上执行。因为在本机模式下測试和调试MapReduce程序较为方便,因此,这样的模式适宜用在开发阶段。

(2)分布式模式(pseudo-distributed model)

当中,分布模式分为两种:伪分布式模式和全分布式模式。
a.伪分布式模式:
伪分布式模式即为“单点集群”。在该模式下全部的守护进程均会执行在单个节点上。

        b.全分布模式(fully distributed model)

        Hadoop守护进程执行在一个真实的集群上,如NameNode、SeconeNameNode、Jobtracker、TaskTracker等分别执行在不同机器上。

注:当中,独立模式和单机模式均执行在单机环境中。

在特定模式下执行Hadoop须要关注两个因素:正确设置属性和启动Hadoop守护进程。

下表列举了配置各种模式所须要的最小属性集合:

组件名称

属性名称

独立模式

伪分布模式

全分布模式

Common

fs.default.name

file:///(默认)

hdfs://localhost/

hdfs://namenode/

HDFS

dfs.replication

N/A

1

3(默认)

MapReduce

mapred.job.tracker

local(默认)

localhost:8021

jobtracker:8021

在独立模式下,将使用本地文件系统(默觉得本地文件系统,也能够设置文件系统为hdfs)和本地MapReduce作业执行。在分布式模式下,将启动HDFS和MapReduce守护进程。

在明晰了上述差别后,我们再说在eclipse中执行hadoop程序的问题。
注:在这里,我们不区分伪分布式模式和全分布式模式。把他们都叫做分布式模式。
在eclipse中执行hadoop程序能够採用本地立模式和分布式模式,假设没有设置mapred.job.tracker属性值的话。默认採用本地模式执行。

本地模式中,文件系统能够使用本地文件系统(file:///)也能够使用HDFS文件系统(hdfs://),假设使用hdfs文件系统的话。则须要设置fs.default.name属性。

本地模式中。mapreduce等一系列过程直接执行在ecipse启动的单个JVM进程内,程序的执行全然与hadoop集群没有不论什么关系(不使用hdfs文件系统的前提下)。这时,你假设关闭了hadoop集群,对程序的执行没有不论什么影响(不使用hdfs文件系统的前提下)。

假设设置了mapred.job.tracker属性值的话。则採用分布式模式执行。eclipse在此事实上是充当了“client”的角色,将程序提交给jobtracker,有jobtracker来分配和管理任务的执行。

事实上就是说eclipse把任务提交给hadoop集群了。这时,你打开jobtracker或者namenode、datanode的相应的网页监控页面的话,能够看到执行状态和日志。

注:上面所说的设置mapred.job.tracker属性值和设置fs.default.name属性值能够在程序中设置Configuration对象或者分别将mapred-site.xml文件(相应mapred.job.tracker配置)、core-site.xml、hdfs-site.xml(这两个文件相应fs.default.name配置)分别放入eclipse
hadoopproject的环境变量中去。


使用hadoop ecipse插件须要注意的问题的更多相关文章

  1. Hadoop学习笔记—6.Hadoop Eclipse插件的使用

    开篇:Hadoop是一个强大的并行软件开发框架,它可以让任务在分布式集群上并行处理,从而提高执行效率.但是,它也有一些缺点,如编码.调试Hadoop程序的难度较大,这样的缺点直接导致开发人员入门门槛高 ...

  2. eclipse添加hadoop开发插件

    在开发hadoop的时候去查找了一下eclipse marketplace是没有找到hadoop的插件,上网又找了一下发现原来hadoop中其实是带有这样的插件的, 其实很简单只要将这个插件复制到ec ...

  3. 每天收获一点点------Hadoop Eclipse插件的使用

    本文所用软件版本:myeclipe2014    hadoop1.2.1 1.安装Hadoop开发插件 下载hadoop-eclipse-plugin-1.2.1.jar,拷贝到myeclipse根目 ...

  4. [原创] 毕设---在myeclipes中安装Hadoop开发插件

    1.安装Hadoop开发插件 hadoop安装包contrib/目录下有个插件hadoop-0.20.2-eclipse-plugin.jar,拷贝到myeclipse根目录下/dropins目录下. ...

  5. hadoop eclipse插件生成

    hadoop eclipse插件生成 做了一年的hadoop开发.还没有自动生成过eclipse插件,一直都是在网上下载别人的用,今天有时间,就把这段遗憾补回来,自己生成一下,废话不说,開始了. 本文 ...

  6. The command ("dfs.browser.action.delete") is undefined 解决Hadoop Eclipse插件报错

    Hadoop Eclipse插件 报错. 使用 hadoop-eclipse-kepler-plugin-2.2.0.jar 如下所示 Error Log 强迫症看了 受不了 The command ...

  7. 更新 hadoop eclipse 插件

    卸载hadoop 1.1.2插件.并安装新版hadoop 2.2.0插件. 假设直接删除eclipse plugin文件夹下的hadoop 1.1.2插件,会导致hadoop 1.1.2插件残留在ec ...

  8. 第四章.使用ant编译hadoop eclipse插件

    从hadoop 0.20.203以后,hadoop的发布包里,不再对eclipse插件进行jar包发布,而是给出了打包的代码,需要各位开发人员自己进行打包和设置.我们打的包必须跟自己使用的hadoop ...

  9. Hadoop Eclipse 插件制作以及安装

    在本地使用Eclipse调试MapReduce程序,需要Hadoop插件,笔摘记录下制作安装过程. 准备工作(hadoop-2.6.0为例): 搭建好Hadoop环境 下载Hadoop安装包,解压到某 ...

随机推荐

  1. 利用 操作符特性 代替if判断语句

    参考:http://blog.csdn.net/speedme/article/details/22916181 1.&&的判断特性 #include <stdio.h> ...

  2. vim的漫漫长征路

    在系统的学习vim之前,先在网上找了些教程大概了解下,因为首先我们要先将vim给用起来,然后在系统的学习过程中不断的充实自己对vim的理解. ----------------------------- ...

  3. json_response的用法

    传统的方法是当我们处理一个表单时,我们Post数据给服务器,服务器对数据进行处理后将数据返回给用户,此时部分写法是用页面刷新的方式将页面重新刷新一次呈现给用户,这样的话用户相当于读入了两次页面,人一多 ...

  4. 编写存储过程导出oracle表数据到多个文本文件

    1.测试表和数据: create table test(id )); begin .. loop insert into test values(k,'test'||k); end loop; end ...

  5. 引用 RAM和ROM和Flash ROM的区别

    用 饿狼 的 RAM和ROM和Flash ROM的区别 RAM(Random Access Memory)的全名为随机存取记忆体,它相当于PC机上的移动存储,用来存储和保存数据的.它在任何时候都可以读 ...

  6. poj 2356鸽笼原理水题

    关于鸽笼原理的知识看我写的另一篇博客 http://blog.csdn.net/u011026968/article/details/11564841 (需要说明的是,我写的代码在有答案时就输出结果了 ...

  7. 关于PhpDE zend ide破解方式

    1.文件和汉化文件 ZendStudio官方下载地址:http://www.geekso.com/component/zendstudio-downloads/ 百度云地址: 10.0.0.msi文件 ...

  8. C# 点击窗口任意位置拖动

    代码: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; ...

  9. 字符串处理-AC自动机

    估计在OJ上刷过题的都会对AC自动机这个名词很感兴趣,同样,记得去年ACM暑期集训的时候,在最后讲到字符串部分,听说了这个算法的名字之后就对于它心向往之,AC正好是Accept的简称,字面意义上的理解 ...

  10. 《Python简明教程》总结

    Python经典教程<Python简明教程> 目录: 为什么Python 安装Python 体验Python Python数据类型 运算符与表达式 控制流 函数 模块 数据结构 解决问题 ...