Hadoop打包成jar包在集群上运行时出现的各种问题以及解决方案

之前将eclipse下编好的mapreduce代码放到集群上面跑，发现速度很慢，namenode节点的cpu和内存使用率很低，datanode节点基本上处于没有运行的状态，然后通过查看hadoop-etc-hadoop下面的配置文件，发现mapreduce-site.xml文件下面的mapreduce.framework.name名字中framework少了一个字母e，导致集群一直运行在伪分布模式下面，同时也导致web控制网页没有datanode的信息，打开master：8088网站显示no available datanode in the table，曾经这个问题困扰了我很久很久，因为如果网站打不开的话就没有办法查看运行的日志，没有办法通过日志来查看运行出错信息。在hadoop2.1以后就通过mapreduce-site.xml配置文件里面的mapreduce.jobhistory.webapp.address下面的value值master：19888网站来查看各个节点的运行状态了，开启jobhistory的命令是mr-jobhistory-sh start historyserver。

运行jar包的时候提示空指针异常 java.lang.NullPointerException分析说明

这个问题也困扰了我相当长的时间，直到后来通过日志log发现原来是程序没有读我的文件（文件格式是xml格式），后来把文件复制到各个节点下面相同的路径里面，然后在代码中输入路径（不可以只放在namenode节点上，不然datanonde读不到文件便会报空指针异常）。

mapreduce框架中全局变量的设置

在我的工程中需要在map函数里面调用一个类的方法，如果在每个map函数里面都新建类的话会导致运行时间很长，内存溢出。这里我想在代码运行之前新建这个类，在map方法里面直接调用这个类的方法，这个过程也困扰了我很长的时间，直到另一个需求的出现，在处理很多文件的时候我希望输出为多个文件，而不是只有一个输出文件。

对于输出多个文件的分析

在程序中加入以下代码

private MultipleOutputs mos;

protected void setup(Context context) throws IOException, InterruptedException { 

  mos=new MultipleOutputs(context);//初始化mos

}

protected void cleanup( Context context) throws IOException, InterruptedException { 

mos.close();//释放资源

} 

public void map（LongWritable key,Text value,Context context) throws IOException,InterruptedException,NullPointerException{

mos.write(new Text(key),new Text(value),filename);

}

实现以filename文件作为输入文件输出map的结果。

这里我就发现了一个地方，在setup方法中新建了一个对象mos，然后在map函数中直接调用mos的方法，而网上说setup方法只运行一次，可以重载自己的功能，然后回到上一个问题，我把需要初始化的对象直接放到setup方法里面，然后在map函数里面执行对象的方法，结果空指针异常消失了，而且不会再每执行一次map函数就新建一个对象，这样减少了内存的消耗。

运行时候出现Error: GC overhead limit exceeded

在hadoop2.x中默认Container的yarn child jvm堆大小为200M，通过参数mapred.child.java.opts指定，可以在job提交的时候给定，是一个客户端生效的参数，配置在mapred-site.xml文件中，通过将该参数修改为-Xms200m -Xmx4096000m来更改jvm堆大小，异常解决。

然后我继续运行jar包工程，运行时出现4.2 GB of 2.1 GB virtual memory used. Killing container.

这个错误和物理内存无关，是虚拟内存超了。

解决方法：

在etc/hadoop/yarn-site.xml文件中，修改检查虚拟内存的属性为false，如下：

<property>

    <name>yarn.nodemanager.vmem-check-enabled</name>

    <value>false</value>

</property>

参考资料：http://blog.csdn.net/ma0903/article/details/48289731

Hadoop打包成jar包在集群上运行时出现的各种问题以及解决方案的更多相关文章

flink idea 打包jar 并放到集群上运行
flink idea 打包jar 并放到集群上运行在开始之前注意前提,当前项目的scala的版本要和集群上的scala一致我已经创建好一个wordCount的flink项目注意项目的po ...
IntelliJ IDEA编写的spark程序在远程spark集群上运行
准备工作需要有三台主机,其中一台主机充当master,另外两台主机分别为slave01,slave02,并且要求三台主机处于同一个局域网下通过命令:ifconfig 可以查看主机的IP地址,如下图 ...
012 Spark在IDEA中打jar包，并在集群上运行（包括local模式，standalone模式，yarn模式的集群运行）
一:打包成jar 1.修改代码 2.使用maven打包但是目录中有中文,会出现打包错误 3.第二种方式 4.下一步 5.下一步 6.下一步 7.下一步 8.下一步 9.完成二:在集群上运行(loc ...
[Java] Java 打包成jar包和解压jar包
解压jar包 jar xf xxx.jar 打包成jar包方法一:通过jar命令 jar命令的用法: 下面是jar命令的帮助说明: 用法:jar {ctxui}[vfm0Me] [jar-file] ...
[JAR包] android引入JAR包，打包成JAR包，打包成Library项目，导入Library项目
(1)项目导入JAR包:1.在项目目录里建立一个libs目录,将外部jar包拷贝在里面.2.右键点击项目,Bulid Path->Configure Build Path3.在设置Libraie ...
【spring boot】idea下springboot打包成jar包和war包，并且可以在外部tomcat下运行访问到(转)
转自:https://www.cnblogs.com/sxdcgaq8080/p/7727249.html 接着上一章走呗:http://www.cnblogs.com/sxdcgaq8080/p ...
【Android端】代码打包成jar包/aar形式
Android端代码打包成jar包和aar形式: 首先,jar包的形式和aar形式有什么区别? 1.打包之后生成的文件地址: *.jar:库/build/intermediates/bundles/d ...
Android studio 将 Module 打包成 Jar 包
整理记录 AndroidStudio 把一个 module 项目打包成 jar 包. 一.默认自动生成的 jar 包众所周知 android studio 会在library所依赖的 app运行或 ...
springboot打包成jar包后找不到xml,找不到主类的解决方法
springboot打包成jar包后找不到xml,找不到主类的解决方法请首先保证你的项目能正常运行(即不打包的时候运行无误),我们在打包时经常遇到如下问题: springboot打包成jar包后找不 ...

随机推荐

如何在Apache中使用PHP处理PHP文件
一.将PHP预处理器作为Apache的模块(插件) Apache软件自身的功能都是基于模块化管理的. 将PHP预处理器作为Apache的一个模块即可. 在apache/conf/httpd.conf的 ...
USACO Section2.1 Sorting a Three-Valued Sequence 解题报告
sort3解题报告 —— icedream61 博客园(转载请注明出处)---------------------------------------------------------------- ...
01--是时候让我们谈谈一致性hash了
--------------------- 假如你有图中三个盒子,我们有代号为 1,4,5,12 这四样东西那根据代号作为主键,将东西放到盒子了,该如何放置? 我们可以对代号取模 1 mod 3 = ...
Opencv3.1.0安装包
这个资源是Opencv3.1.0安装包,包括Windows软件包,Android软件包,IOS软件包,还有opencv的源代码:需要的下载吧. 点击下载
爬虫：Scrapy10 - Link Extractors
Link Extractors 适用于从网页(scrapy.http.Response)中抽取会被 follow 的链接的对象. Scrapy 默认提供 2 种可用的 Link Extractor,但 ...
Android记事本07
昨天: activity横竖屏切换的生命周期今天: Anr异常的原因和解决方案遇到的问题: 无.
Qt-Creator 加入qwt库
qwt是基于Qt的开源图表库从官网下载qwt的源码 http://sourceforge.jp/projects/sfnet_qwt/downloads/qwt/6.1.0/qwt-6.1.0.ta ...
【bzoj4177】Mike的农场网络流最小割
题目描述 Mike有一个农场,这个农场n个牲畜围栏,现在他想在每个牲畜围栏中养一只动物,每只动物可以是牛或羊,并且每个牲畜围栏中的饲养条件都不同,其中第i个牲畜围栏中的动物长大后,每只牛可以卖a[i] ...
hdu 2553 N皇后问题 (DFS)
N皇后问题 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submi ...
类复制 MemberwiseClone与Clone(深浅 Clone)
MemberwiseClone 方法创建一个浅表副本,具体来说就是创建一个新对象,然后将当前对象的非静态字段复制到该新对象.如果字段是值类型的,则对该字段执行逐位复制.如果字段是引用类型,则复制引用但 ...

Hadoop打包成jar包在集群上运行时出现的各种问题以及解决方案

Hadoop打包成jar包在集群上运行时出现的各种问题以及解决方案的更多相关文章

随机推荐

热门专题