构建完毕Hadoop项目后,接下来就应该跟踪Hadoop的运行情况,比方在命令行运行hadoop namenode–format时运行了Hadoop的那些代码。当然也能够直接通过阅读源码的方式来做到这一点,但跟踪代码的运行情况更加直观,更easy理解。

动手配置Eclipse调试Hadoop之前,先大概学习一下JPDA(Java Platform Debugger Architecture,Java平台调试结构)。JPDA是一个多层的调试架构,使工具开发人员能够easy地创建跨平台的,跨VM实现和JDK版本号的调试器。JPDA包括三层:

  • JVM TI:Java VM ToolInterface,定义了VM提供的调试服务。
  • JDWP:Java DebugWire Protocol,定义了调试器进程和debuggee之间的通讯。Debuggee是正在被调试的进程,包括正在被调试的应用程序,执行该应用        程序的VM和后端的调试器。
  • JDI:Java DebugInterface,定义了高层次的Java接口,该接口同意工具开发人员easy地编写远程调试器应用程序。

JPDA的结构图例如以下所看到的:

在简介了JPDA的基本信息后(很粗浅,更深入的学习能够參考Java的官方文档,地址为http://docs.oracle.com/javase/8/docs/technotes/guides/jpda/architecture.html#debuggee),以下就要看看该怎样使用JPDA进行程序的调试。

VM的实现须要命令行选项载入JDWP代理用于调试。从5.0開始,-agentlib:jdwp选项用于载入JDWP代理和指定JDWP代理的选项,5.0之前的版本号使用-Xdebug和-Xrunjdwp选项(5.0版本号也支持-Xdebug和-Xrunjdwp选项)。假设目标虚拟机是5.0或者更新的版本号,-agentlib:jdwp的使用方式为:-agentlib:jdwp=<sub-options>,5.0版本号之前的使用方式为:-Xdebug(启用调试)
-Xrunjdwp:<sub-options>。<sub-options>能够进一步指定,格式为:-agentlib:jdwp=<name1>[=<value1>],<name2>[=<value2>]...和 -Xrunjdwp:<name1>[=<value1>],<name2>[=<value2>]...。当中的name能够为例如以下:help、transport、server、address、timeout、launch、onthrow、onuncaught、suspend。当中经常使用的几个为transport、server、address和suspend,transport是指调试器和被调试的VM之间的通信方法,其值能够为dt_socket和dt_shmem;server的值为y或者n,默认值为n,当值为y时,监听调试器程序的连接,否则在address指定的地址上连接调试器;address指定了连接的地址,假设server=y,则在该地址上监听连接,若server=n,则在该地址上连接调试器;suspend的值为y或者n,假设值为y则表示JVM在调试器连接到它之前都会处于暂停状态(更具体的内容能够參考官网文档http://docs.oracle.com/javase/7/docs/technotes/guides/jpda/conninv.html)。以下看几个样例:

-Xdebug -Xrunjdwp:transport= dt_socket,address=1044,server=y,suspend=n
-agentlib:jdwp=transport=dt_socket,server=y,address=8000
-agentlib:jdwp=transport=dt_socket,address=myhost:8000

在学习了JPDA后,接下来就要配置Eclipse调试Hadoop。打开HADOOP_HOME/bin下的hadoop脚本,找到例如以下的代码:

elif [ "$COMMAND" = "namenode" ] ; then
CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode'
HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS "

将其改为:

elif [ "$COMMAND" = "namenode" ] ; then
CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode'
HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS -agentlib:jdwp=transport=dt_socket,server=y,address=6601,suspend=y"

新加入代码的意思为启用Java 调试器,并在port6601上监听。做完上述的改动后再打开Eclipse,点击Run菜单下的Debug Configurations子菜单,例如以下图所看到的:

先选择Remote Java Application,然后点击上面的New launch configurationbutton,出现下图所看到的的对话框,在右側分别输入对应的信息,比方主机名称和port号,port与上面改动hadoop文件时address指定的值保持一致。

做完上述的配置后,在命令上运行hadoop命令,比方hadoopnamenode –format,命令行的输出显示正在port6601上监听:

[hadoop@hadoop conf]$ hadoop namenode -format
Listening for transport dt_socket at address: 6601 [hadoop@hadoop bin]$ start-all.sh
starting namenode, logging to /home/hadoop/hadoop-1.2.1/libexec/../logs/hadoop-hadoop-namenode-hadoop.out
Listening for transport dt_socket at address: 6601

点击上图右下側的Debugbutton,開始调试Hadoop,调试的情况例如以下图所看到的,能够设置断点跟踪代码的运行情况。

上面所讲的仅仅是怎样调试NameNode,DataNode的调试与此类似,不再赘述,而MapReduce作业的调试还有待进一步的研究。

Hadoop学习之配置Eclipse远程调试Hadoop的更多相关文章

  1. eclipse远程调试Hadoop

    环境需求: 系统:window 10 eclipse版本:Mars Hadoop版本:2.6.0 资源需求:解压后的Hadoop-2.6.0,原压缩包自行下载:下载地址 丑话前头说: 以下的操作中,e ...

  2. 《Hadoop学习之路》学习实践二——配置idea远程调试hadoop

    背景:在上篇文章中按照大神“扎心了老铁”的博客,在服务器上搭建了hadoop的伪分布式环境.大神的博客上是使用eclipse来调试,但是我入门以来一直用的是idea,eclipse已经不习惯,于是便摸 ...

  3. Hadoop学习记录(7)|Eclipse远程调试Hadoop

    1.创建Hadoop项目 2.创建包.类 这里使用hdfs.WordCount为例 3.编写自定Mapper和Reducer程序 MyMapper类 static class MyMapper ext ...

  4. Eclipse远程调试hadoop源码

    1. 修改对应调试端口 之前的一篇blog里讲述了hadoop单机版调试的方法,那种调试只限于单机运行hadoop命令而已,对于运行整个hadoop环境而言是不可取的,因为hadoop会开启多个jav ...

  5. IDEA远程调试hadoop程序

    远程调试Hadoop各组件 Hadoop学习之配置Eclipse远程调试Hadoop IDEA远程调试hadoop Hadoop 研发之远程调试详细剖析--WordCount V2.0 eclipse ...

  6. Eclipse远程调试HDP源代码

    使用的是自己编译的HDP2.3.0的源代码编译的集群,此文介绍如何使用Eclipse远程调试Hadoop内核源代码,以调试namenode为例进行介绍. 在/usr/hdp/2.3.0.0-2557/ ...

  7. Linux下使用Eclipse 远程调试

    1 开启端口 修改/apache-tomcat-7.0.40/bin/catalina.sh 在合适的位置(请自行判断,只要有JAVA_OPTS的设定前后即可)插入下面的设定:UI_DEBUG=&qu ...

  8. eclipse/intellij idea 远程调试hadoop 2.6.0

    很多hadoop初学者估计都我一样,由于没有足够的机器资源,只能在虚拟机里弄一个linux安装hadoop的伪分布,然后在host机上win7里使用eclipse或Intellj idea来写代码测试 ...

  9. 使用Windows上Eclipse远程调试Linux上的Hadoop

    一.设置Eclipse运行用户     如果以与Hadoop运行用户名(比如grid)不同的用户运行Eclipse,则无法对Hadoop运行用户所属的文件进行管理,运行Map/Reduce程序也会报& ...

随机推荐

  1. mysql_install_db出错,Unable to lock /usr/local/mysql/var/ibdata1, error: 11

    今天,在一台旧机器上编译一个新的Mysql,install时出了错: /usr/local/mysql_5615/scripts/mysql_install_db --user=mysql --bas ...

  2. 概率统计(DP)

    问题叙述性说明 生成n个月∈[a,b]随机整数.并且将它们输出到x概率. 输入格式 输入线跟四个整数n.a,b,x,用空格分隔. 输出格式 输出一行包括一个小数位和为x的概率.小数点后保留四位小数 例 ...

  3. poj 1975 Median Weight Bead(传递闭包 Floyd)

    链接:poj 1975 题意:n个珠子,给定它们之间的重量关系.按重量排序.求确定肯定不排在中间的珠子的个数 分析:由于n为奇数.中间为(n+1)/2,对于某个珠子.若有至少有(n+1)/2个珠子比它 ...

  4. 如何识别SQL Server中的CPU瓶颈

    原文:如何识别SQL Server中的CPU瓶颈 原文出自: http://www.mssqltips.com/sqlservertip/2316/how-to-identify-sql-server ...

  5. 严格模式 (JavaScript)

    严格模式是一种将更好的错误检查引入代码中的方法. 在使用严格模式时,您无法使用隐式声明的变量.将值赋给只读属性或将属性添加到不可扩展的对象. 〉声明严格模式 可以通过在文件.程序或函数的开头添加 &q ...

  6. springmvc 接收对象 滴灌摘要

    js 对象 该阵列看起来像 我明白http://blog.csdn.net/baicp3/article/details/12752255本文 我们指示样品棒 data3一个js对象.遗嘱java当代 ...

  7. struts2跳转类型解析

    struts 2 跳转类型 1.dispatcher  dispatcher 为默认跳转类型.用于返回一个视图资源 xml代码 : <result name="success" ...

  8. emacs quick open and jump file (or buffer) which name is current word

    Sometime, we need to open a file or buffer which name begin with current word in emacs. Here I give ...

  9. Event Sourcing - ENode(三)

    接上一篇 http://www.cnblogs.com/dopeter/p/4903328.html 老板昨天在第二篇介绍中回复代码和文字无法一一对应.为了更好的让老板为大家解惑,把第二篇最后的猜测的 ...

  10. log4j+logback+slf4j+commons-logging的关系与调试(转)

    背景     由于现在开源框架日益丰富,好多开源框架使用的日志组件不尽相同.存在着在一个项目中,不同的版本,不同的框架共存.导致日志输出异常混乱.虽然也不至于对系统造成致命伤害,但是明显可以看出,架构 ...