Hadoop学习之配置Eclipse远程调试Hadoop

构建完毕Hadoop项目后，接下来就应该跟踪Hadoop的运行情况，比方在命令行运行hadoop namenode–format时运行了Hadoop的那些代码。当然也能够直接通过阅读源码的方式来做到这一点，但跟踪代码的运行情况更加直观，更easy理解。

动手配置Eclipse调试Hadoop之前，先大概学习一下JPDA（Java Platform Debugger Architecture，Java平台调试结构）。JPDA是一个多层的调试架构，使工具开发人员能够easy地创建跨平台的，跨VM实现和JDK版本号的调试器。JPDA包括三层：

JVM TI：Java VM ToolInterface，定义了VM提供的调试服务。
JDWP：Java DebugWire Protocol，定义了调试器进程和debuggee之间的通讯。Debuggee是正在被调试的进程，包括正在被调试的应用程序，执行该应用程序的VM和后端的调试器。
JDI：Java DebugInterface，定义了高层次的Java接口，该接口同意工具开发人员easy地编写远程调试器应用程序。

JPDA的结构图例如以下所看到的：

在简介了JPDA的基本信息后（很粗浅，更深入的学习能够參考Java的官方文档，地址为http://docs.oracle.com/javase/8/docs/technotes/guides/jpda/architecture.html#debuggee），以下就要看看该怎样使用JPDA进行程序的调试。

VM的实现须要命令行选项载入JDWP代理用于调试。从5.0開始，-agentlib:jdwp选项用于载入JDWP代理和指定JDWP代理的选项，5.0之前的版本号使用-Xdebug和-Xrunjdwp选项（5.0版本号也支持-Xdebug和-Xrunjdwp选项）。假设目标虚拟机是5.0或者更新的版本号，-agentlib:jdwp的使用方式为：-agentlib:jdwp=<sub-options>，5.0版本号之前的使用方式为：-Xdebug（启用调试）
-Xrunjdwp:<sub-options>。<sub-options>能够进一步指定，格式为：-agentlib:jdwp=<name1>[=<value1>],<name2>[=<value2>]...和 -Xrunjdwp:<name1>[=<value1>],<name2>[=<value2>]...。当中的name能够为例如以下：help、transport、server、address、timeout、launch、onthrow、onuncaught、suspend。当中经常使用的几个为transport、server、address和suspend，transport是指调试器和被调试的VM之间的通信方法，其值能够为dt_socket和dt_shmem；server的值为y或者n，默认值为n，当值为y时，监听调试器程序的连接，否则在address指定的地址上连接调试器；address指定了连接的地址，假设server=y，则在该地址上监听连接，若server=n，则在该地址上连接调试器；suspend的值为y或者n，假设值为y则表示JVM在调试器连接到它之前都会处于暂停状态（更具体的内容能够參考官网文档http://docs.oracle.com/javase/7/docs/technotes/guides/jpda/conninv.html）。以下看几个样例：

-Xdebug -Xrunjdwp:transport= dt_socket,address=1044,server=y,suspend=n

-agentlib:jdwp=transport=dt_socket,server=y,address=8000

-agentlib:jdwp=transport=dt_socket,address=myhost:8000

在学习了JPDA后，接下来就要配置Eclipse调试Hadoop。打开HADOOP_HOME/bin下的hadoop脚本，找到例如以下的代码：

elif [ "$COMMAND" = "namenode" ] ; then

  CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode'

  HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS "

将其改为：

elif [ "$COMMAND" = "namenode" ] ; then

  CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode'

  HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS -agentlib:jdwp=transport=dt_socket,server=y,address=6601,suspend=y"

新加入代码的意思为启用Java 调试器，并在port6601上监听。做完上述的改动后再打开Eclipse，点击Run菜单下的Debug Configurations子菜单，例如以下图所看到的：

先选择Remote Java Application，然后点击上面的New launch configurationbutton，出现下图所看到的的对话框，在右側分别输入对应的信息，比方主机名称和port号，port与上面改动hadoop文件时address指定的值保持一致。

做完上述的配置后，在命令上运行hadoop命令，比方hadoopnamenode –format，命令行的输出显示正在port6601上监听：

[hadoop@hadoop conf]$ hadoop namenode -format

Listening for transport dt_socket at address: 6601

[hadoop@hadoop bin]$ start-all.sh

starting namenode, logging to /home/hadoop/hadoop-1.2.1/libexec/../logs/hadoop-hadoop-namenode-hadoop.out

Listening for transport dt_socket at address: 6601

点击上图右下側的Debugbutton，開始调试Hadoop，调试的情况例如以下图所看到的，能够设置断点跟踪代码的运行情况。

上面所讲的仅仅是怎样调试NameNode，DataNode的调试与此类似，不再赘述，而MapReduce作业的调试还有待进一步的研究。

Hadoop学习之配置Eclipse远程调试Hadoop的更多相关文章

eclipse远程调试Hadoop
环境需求: 系统:window 10 eclipse版本:Mars Hadoop版本:2.6.0 资源需求:解压后的Hadoop-2.6.0,原压缩包自行下载:下载地址丑话前头说: 以下的操作中,e ...
《Hadoop学习之路》学习实践二——配置idea远程调试hadoop
背景:在上篇文章中按照大神“扎心了老铁”的博客,在服务器上搭建了hadoop的伪分布式环境.大神的博客上是使用eclipse来调试,但是我入门以来一直用的是idea,eclipse已经不习惯,于是便摸 ...
Hadoop学习记录（7）|Eclipse远程调试Hadoop
1.创建Hadoop项目 2.创建包.类这里使用hdfs.WordCount为例 3.编写自定Mapper和Reducer程序 MyMapper类 static class MyMapper ext ...
Eclipse远程调试hadoop源码
1. 修改对应调试端口之前的一篇blog里讲述了hadoop单机版调试的方法,那种调试只限于单机运行hadoop命令而已,对于运行整个hadoop环境而言是不可取的,因为hadoop会开启多个jav ...
IDEA远程调试hadoop程序
远程调试Hadoop各组件 Hadoop学习之配置Eclipse远程调试Hadoop IDEA远程调试hadoop Hadoop 研发之远程调试详细剖析--WordCount V2.0 eclipse ...
Eclipse远程调试HDP源代码
使用的是自己编译的HDP2.3.0的源代码编译的集群,此文介绍如何使用Eclipse远程调试Hadoop内核源代码,以调试namenode为例进行介绍. 在/usr/hdp/2.3.0.0-2557/ ...
Linux下使用Eclipse 远程调试
1 开启端口修改/apache-tomcat-7.0.40/bin/catalina.sh 在合适的位置(请自行判断,只要有JAVA_OPTS的设定前后即可)插入下面的设定:UI_DEBUG=&qu ...
eclipse/intellij idea 远程调试hadoop 2.6.0
很多hadoop初学者估计都我一样,由于没有足够的机器资源,只能在虚拟机里弄一个linux安装hadoop的伪分布,然后在host机上win7里使用eclipse或Intellj idea来写代码测试 ...
使用Windows上Eclipse远程调试Linux上的Hadoop
一.设置Eclipse运行用户如果以与Hadoop运行用户名(比如grid)不同的用户运行Eclipse,则无法对Hadoop运行用户所属的文件进行管理,运行Map/Reduce程序也会报& ...

随机推荐

C# WinForm 拖动无边框窗体改变无边框窗体尺寸
经常遇到这种情况.窗体的边框去掉了.然后种种问题就出来了:不能拖动.不能改变窗体大小.不能．．．．．．当然.肯定有解决方案滴*^_^*今天的目标就是:可以直接拖动没有边框的窗体.可以直接拉拽窗体改变其 ...
c++输入密码以星号代替
#include <iostream> #include <string>//注意这里的头文件! #include<conio.h> using namespace ...
Android应用程序绑定服务（bindService）的过程源码分析
Android应用程序组件Service与Activity一样,既能够在新的进程中启动,也能够在应用程序进程内部启动:前面我们已经分析了在新的进程中启动Service的过程,本文将要介绍在应用程序内部 ...
UIButton 文字图片排列
UIButton缺省值是:图画-文字水平,所以我们并不需要调整. 1.写作-图画水平显示,以前的文本,图片后再次 [btn setTitleEdgeInsets:UIEdgeInsetsMake(0 ...
UFLDL接听教程练习（来自编码器和矢量编程疏）
最近想在深入学习研究,开始看UFLDL(unsuprisedfeature learning and deep learning)教程了.特将课后习题答案放在这里,作为一个笔记. 笔记: 1:自编码算 ...
React-Native基础教程
React-Native牛刀小试仿京东砍啊砍砍到你手软 React-Native基础教程 *React-Native基础篇作者git *React-Native官方文档 *Demo 几个月前faceb ...
介绍4种HTML5 Canvas库
1.bHive.js Library http://www.bhivecanvas.com/ bHive能创建丰富的用户体验.动画.游戏,能够使开发更简单. demo: http://www.bhiv ...
物理卷操作命令：pvcreate,pvscan,pvdisplay.卷组操作命令：vgcreate,vgdisplay. （转）
新硬盘创建LVM系统过程. 物理卷操作命令:pvcreate,pvscan,pvdisplay. 卷组操作命令:vgcreate,vgdisplay. 逻辑卷操作命令:lvcreate,lvdispl ...
How use Instruments and display the console in Command Lines applications
I'm using Xcode on OSX to develop command line C applications. I would also like to use Instruments ...
MEF初体验之六：导出和元素据
在导出声明这一节中解释了部件导出服务和值的基础知识.在某些情况下,出于多种原因,关联与导出相关的信息是有必要的.通常,它被用来解释一个指定的普通契约实现的能力.这对于允许导入约束满足它的导出,或者导入 ...

Hadoop学习之配置Eclipse远程调试Hadoop

Hadoop学习之配置Eclipse远程调试Hadoop的更多相关文章

随机推荐

热门专题