使用hadoop ecipse插件须要注意的问题

1.关于run on hadoop的问题：

在未用hadoop eclipse插件前，我以为通过hadoop eclipse 插件不但能够管理hdfs，还能够自己主动打包程序。并帮我自己主动设置Configuration对象的mapred.jar属性值。但用了之后，才发现，这个插件仅仅能管理hdfs。至于打包程序等操作，还得自己手动进行。

我用的hadoop 版本号为1.2.1，hadoop eclipse插件个人亲自编译生成，保证无不论什么问题，我一開始用的是MyEclipse后来换成Eclipse。但试用了，仍存在这个问题。

"run
as——>run on hadoop"并未弹出例如以下所看到的窗体：

而是直接执行了，效果跟"run as——>run configurations——>填写參数值——>run"的效果一致。

不知道是不是这个hadoop 1.2.1版本号的ecipse插件都存在这个问题，还是我个人使用出现的问题，假设有哪位童鞋们知道这个问题，能够赐教下！

2.关于通过ecipse设置hadoop执行模式的问题：

说先，我们要明白hadoop的执行模式以及各种执行模式的差别，參考例如以下：

（1）独立模式<standalone>（也叫本地模式<local
mode>）

独立模式全然执行在本地。不会载入不论什么MapReduce服务，因而不会涉及Mapreduce最核心的代码实现。

独立模式无需执行不论什么守护进程（daemon），全部程序都在单个JVM上执行。因为在本机模式下測试和调试MapReduce程序较为方便，因此，这样的模式适宜用在开发阶段。

（2）分布式模式（pseudo-distributed model）

当中，分布模式分为两种：伪分布式模式和全分布式模式。

a.伪分布式模式：

伪分布式模式即为“单点集群”。在该模式下全部的守护进程均会执行在单个节点上。

b.全分布模式（fully distributed model）

Hadoop守护进程执行在一个真实的集群上，如NameNode、SeconeNameNode、Jobtracker、TaskTracker等分别执行在不同机器上。

注：当中，独立模式和单机模式均执行在单机环境中。

在特定模式下执行Hadoop须要关注两个因素：正确设置属性和启动Hadoop守护进程。

下表列举了配置各种模式所须要的最小属性集合：

组件名称	属性名称	独立模式	伪分布模式	全分布模式
Common	fs.default.name	file:///（默认）	hdfs://localhost/	hdfs://namenode/
HDFS	dfs.replication	N/A	1	3（默认）
MapReduce	mapred.job.tracker	local（默认）	localhost:8021	jobtracker:8021

在独立模式下，将使用本地文件系统（默觉得本地文件系统，也能够设置文件系统为hdfs）和本地MapReduce作业执行。在分布式模式下，将启动HDFS和MapReduce守护进程。

在明晰了上述差别后，我们再说在eclipse中执行hadoop程序的问题。

注：在这里，我们不区分伪分布式模式和全分布式模式。把他们都叫做分布式模式。

在eclipse中执行hadoop程序能够採用本地立模式和分布式模式，假设没有设置mapred.job.tracker属性值的话。默认採用本地模式执行。

本地模式中，文件系统能够使用本地文件系统(file:///)也能够使用HDFS文件系统(hdfs://)，假设使用hdfs文件系统的话。则须要设置fs.default.name属性。

本地模式中。mapreduce等一系列过程直接执行在ecipse启动的单个JVM进程内，程序的执行全然与hadoop集群没有不论什么关系(不使用hdfs文件系统的前提下)。这时，你假设关闭了hadoop集群，对程序的执行没有不论什么影响（不使用hdfs文件系统的前提下）。

假设设置了mapred.job.tracker属性值的话。则採用分布式模式执行。eclipse在此事实上是充当了“client”的角色，将程序提交给jobtracker，有jobtracker来分配和管理任务的执行。

事实上就是说eclipse把任务提交给hadoop集群了。这时，你打开jobtracker或者namenode、datanode的相应的网页监控页面的话，能够看到执行状态和日志。

注：上面所说的设置mapred.job.tracker属性值和设置fs.default.name属性值能够在程序中设置Configuration对象或者分别将mapred-site.xml文件（相应mapred.job.tracker配置）、core-site.xml、hdfs-site.xml（这两个文件相应fs.default.name配置）分别放入eclipse
hadoopproject的环境变量中去。

使用hadoop ecipse插件须要注意的问题的更多相关文章

Hadoop学习笔记—6.Hadoop Eclipse插件的使用
开篇:Hadoop是一个强大的并行软件开发框架,它可以让任务在分布式集群上并行处理,从而提高执行效率.但是,它也有一些缺点,如编码.调试Hadoop程序的难度较大,这样的缺点直接导致开发人员入门门槛高 ...
eclipse添加hadoop开发插件
在开发hadoop的时候去查找了一下eclipse marketplace是没有找到hadoop的插件,上网又找了一下发现原来hadoop中其实是带有这样的插件的, 其实很简单只要将这个插件复制到ec ...
每天收获一点点------Hadoop Eclipse插件的使用
本文所用软件版本:myeclipe2014 hadoop1.2.1 1.安装Hadoop开发插件下载hadoop-eclipse-plugin-1.2.1.jar,拷贝到myeclipse根目 ...
[原创] 毕设---在myeclipes中安装Hadoop开发插件
1.安装Hadoop开发插件 hadoop安装包contrib/目录下有个插件hadoop-0.20.2-eclipse-plugin.jar,拷贝到myeclipse根目录下/dropins目录下. ...
hadoop eclipse插件生成
hadoop eclipse插件生成做了一年的hadoop开发.还没有自动生成过eclipse插件,一直都是在网上下载别人的用,今天有时间,就把这段遗憾补回来,自己生成一下,废话不说,開始了. 本文 ...
The command ("dfs.browser.action.delete") is undefined 解决Hadoop Eclipse插件报错
Hadoop Eclipse插件报错. 使用 hadoop-eclipse-kepler-plugin-2.2.0.jar 如下所示 Error Log 强迫症看了受不了 The command ...
更新 hadoop eclipse 插件
卸载hadoop 1.1.2插件.并安装新版hadoop 2.2.0插件. 假设直接删除eclipse plugin文件夹下的hadoop 1.1.2插件,会导致hadoop 1.1.2插件残留在ec ...
第四章.使用ant编译hadoop eclipse插件
从hadoop 0.20.203以后,hadoop的发布包里,不再对eclipse插件进行jar包发布,而是给出了打包的代码,需要各位开发人员自己进行打包和设置.我们打的包必须跟自己使用的hadoop ...
Hadoop Eclipse 插件制作以及安装
在本地使用Eclipse调试MapReduce程序,需要Hadoop插件,笔摘记录下制作安装过程. 准备工作(hadoop-2.6.0为例): 搭建好Hadoop环境下载Hadoop安装包,解压到某 ...

随机推荐

利用操作符特性代替if判断语句
参考:http://blog.csdn.net/speedme/article/details/22916181 1.&&的判断特性 #include <stdio.h> ...
vim的漫漫长征路
在系统的学习vim之前,先在网上找了些教程大概了解下,因为首先我们要先将vim给用起来,然后在系统的学习过程中不断的充实自己对vim的理解. ----------------------------- ...
json_response的用法
传统的方法是当我们处理一个表单时,我们Post数据给服务器,服务器对数据进行处理后将数据返回给用户,此时部分写法是用页面刷新的方式将页面重新刷新一次呈现给用户,这样的话用户相当于读入了两次页面,人一多 ...
编写存储过程导出oracle表数据到多个文本文件
1.测试表和数据: create table test(id )); begin .. loop insert into test values(k,'test'||k); end loop; end ...
引用 RAM和ROM和Flash ROM的区别
用饿狼的 RAM和ROM和Flash ROM的区别 RAM(Random Access Memory)的全名为随机存取记忆体,它相当于PC机上的移动存储,用来存储和保存数据的.它在任何时候都可以读 ...
poj 2356鸽笼原理水题
关于鸽笼原理的知识看我写的另一篇博客 http://blog.csdn.net/u011026968/article/details/11564841 (需要说明的是,我写的代码在有答案时就输出结果了 ...
关于PhpDE zend ide破解方式
1.文件和汉化文件 ZendStudio官方下载地址:http://www.geekso.com/component/zendstudio-downloads/ 百度云地址: 10.0.0.msi文件 ...
C# 点击窗口任意位置拖动
代码: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; ...
字符串处理-AC自动机
估计在OJ上刷过题的都会对AC自动机这个名词很感兴趣,同样,记得去年ACM暑期集训的时候,在最后讲到字符串部分,听说了这个算法的名字之后就对于它心向往之,AC正好是Accept的简称,字面意义上的理解 ...
《Python简明教程》总结
Python经典教程<Python简明教程> 目录: 为什么Python 安装Python 体验Python Python数据类型运算符与表达式控制流函数模块数据结构解决问题 ...

使用hadoop ecipse插件须要注意的问题

使用hadoop ecipse插件须要注意的问题的更多相关文章

随机推荐

热门专题