hive： insert数据时Error during job, obtaining debugging information 以及beyond physical memory limits

insert overwrite table canal_amt1......

2014-10-09 10:40:27,368 Stage-1 map = 100%,  reduce = 32%, Cumulative CPU 2772.48 sec

2014-10-09 10:40:28,426 Stage-1 map = 100%,  reduce = 32%, Cumulative CPU 2772.48 sec

2014-10-09 10:40:29,481 Stage-1 map = 100%,  reduce = 32%, Cumulative CPU 2774.12 sec

2014-10-09 10:40:30,885 Stage-1 map = 100%,  reduce = 32%, Cumulative CPU 2774.36 sec

2014-10-09 10:40:31,963 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2693.96 sec

2014-10-09 10:40:33,071 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2693.96 sec

2014-10-09 10:40:34,126 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2693.96 sec

2014-10-09 10:40:35,182 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2693.96 sec

MapReduce Total cumulative CPU time: 44 minutes 53 seconds 960 msec

Ended Job = job_1409124602974_0745 with errors

Error during job, obtaining debugging information...

Examining task ID: task_1409124602974_0745_m_000003 (and more) from job job_1409124602974_0745

Examining task ID: task_1409124602974_0745_m_000002 (and more) from job job_1409124602974_0745

Examining task ID: task_1409124602974_0745_r_000000 (and more) from job job_1409124602974_0745

Examining task ID: task_1409124602974_0745_r_000006 (and more) from job job_1409124602974_0745

Task with the most failures(4):

-----

Task ID:

  task_1409124602974_0745_r_000003

URL:

  http://HADOOP2:8088/taskdetails.jsp?jobid=job_1409124602974_0745&tipid=task_1409124602974_0745_r_000003

-----

Diagnostic Messages for this Task:

Container [pid=22068,containerID=container_1409124602974_0745_01_000047] is running beyond physical memory limits. Current usage: 1.0 GB of 1 GB physical memory used; 2.6 GB of 2.1 GB virtual memory used. Killing container.

Dump of the process-tree for container_1409124602974_0745_01_000047 :

        |- PID PPID PGRPID SESSID CMD_NAME USER_MODE_TIME(MILLIS) SYSTEM_TIME(MILLIS) VMEM_USAGE(BYTES) RSSMEM_USAGE(PAGES) FULL_CMD_LINE

        |- 22087 22068 22068 22068 (java) 2536 833 2730713088 265378 /usr/jdk64/jdk1.6.0_31/bin/java -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN -Xmx2048m -Djava.io.tmpdir=/hadoop/yarn/local/usercache/root/appcache/application_1409124602974_0745/container_1409124602974_0745_01_000047/tmp -Dlog4j.configuration=container-log4j.properties -Dyarn.app.container.log.dir=/hadoop/yarn/log/application_1409124602974_0745/container_1409124602974_0745_01_000047 -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA org.apache.hadoop.mapred.YarnChild 54.0.88.58 41150 attempt_1409124602974_0745_r_000003_3 47

        |- 22068 2381 22068 22068 (bash) 1 1 110755840 302 /bin/bash -c /usr/jdk64/jdk1.6.0_31/bin/java -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN -Xmx2048m -Djava.io.tmpdir=/hadoop/yarn/local/usercache/root/appcache/application_1409124602974_0745/container_1409124602974_0745_01_000047/tmp -Dlog4j.configuration=container-log4j.properties -Dyarn.app.container.log.dir=/hadoop/yarn/log/application_1409124602974_0745/container_1409124602974_0745_01_000047 -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA org.apache.hadoop.mapred.YarnChild 54.0.88.58 41150 attempt_1409124602974_0745_r_000003_3 47 1>/hadoop/yarn/log/application_1409124602974_0745/container_1409124602974_0745_01_000047/stdout 2>/hadoop/yarn/log/application_1409124602974_0745/container_1409124602974_0745_01_000047/stderr  

Container killed on request. Exit code is 143

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

MapReduce Jobs Launched:

Job 0: Map: 23  Reduce: 7   Cumulative CPU: 2693.96 sec   HDFS Read: 6278784712 HDFS Write: 590228229 FAIL

Total MapReduce CPU Time Spent: 44 minutes 53 seconds 960 msec

原因：空间不足

解决办法：

在执行hive语句前加上

set mapreduce.map.memory.mb=1025;//只要大于1024，hive默认分配的内存分大一倍，也就是2048M

set mapreduce.reduce.memory.mb=1025;

执行结果：

MapReduce Total cumulative CPU time: 0 days 1 hours 10 minutes 14 seconds 590 msec

Ended Job = job_1409124602974_0746

Loading data to table default.canal_amt1

Table default.canal_amt1 stats: [num_partitions: 0, num_files: 7, num_rows: 0, total_size: 4131948868, raw_data_size: 0]

MapReduce Jobs Launched:

Job 0: Map: 23  Reduce: 7   Cumulative CPU: 4214.59 sec   HDFS Read: 6278784712 HDFS Write: 4131948868 SUCCESS

Total MapReduce CPU Time Spent: 0 days 1 hours 10 minutes 14 seconds 590 msec

OK

Time taken: 673.851 seconds

网上查询可能其他原因：

1.map阶段报空指针

原因：数据字段中插入了空值

2.Exception in thread "Thread-19" java.lang.IllegalArgumentException:
Does not contain a valid host:port authority: local

参考http://grokbase.com/p/cloudera/cdh-user/126wqvfwyt/hive-refuses-to-work-with-yarn

解决方法：

就是在hive-site.xml中添加设置

In the meantime I recommend doing the following if you need to run Hive on

MR2:

* Keep Hive happy by setting mapred.job.tracker to a bogus value.

* Disable task log retrieval by setting

hive.exec.show.job.failure.debug.info=false

3.protuf版本不一致。

hive： insert数据时Error during job, obtaining debugging information 以及beyond physical memory limits的更多相关文章

使用Sqoop从mysql向hdfs或者hive导入数据时出现的一些错误
1.原表没有设置主键,出现错误提示: ERROR tool.ImportTool: Error during import: No primary key could be found for tab ...
PHP使用prepare()，insert数据时要注意的一点！！！
今天看了PHP防SQL注入,使用预处理prepare,但是我insert数据时,总是插不进去,但是select却可以,弄了很久终于知道原来问题在这里,先上代码 <?php header('con ...
iOS解析数据时Error=3840
1.解析JSon数据格式出错的问题 unescaped control character around character XXXX 和 The data couldn’t be read beca ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十三）kafka+spark streaming打包好的程序提交时提示虚拟内存不足（Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical memory used; 2.2 GB of 2.1 G）
异常问题:Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical mem ...
mysql中在表中insert数据时，有重复主键id时，变成update
MySQL 自4.1版以后开始支持INSERT … ON DUPLICATE KEY UPDATE语法例如: id name sex age 1 kathy male 23 2 Javer f ...
peewee insert 数据时报错：'buffer' object has no attribute 'translate'
错误信息: "'buffer' object has no attribute 'translate'" 场景:使用peewee insert 数据时,BlobField 字段存储 ...
hive insert 动态分区异常(Error encountered near token)与解决
当insert数据到有分区的hive表里时若不明显指定分区会抛出异常 insert overwrite table persons_tmp select * from persons; FAILED: ...
sqoop从hive导入数据到mysql时出现主键冲突
今天在将一个hive数仓表导出到mysql数据库时出现进度条一直维持在95%一段时间后提示失败的情况,搞了好久才解决.使用的环境是HUE中的Oozie的workflow任何调用sqoop命令,该死的o ...
Hive读取外表数据时跳过文件行首和行尾
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处有时候用hive读取外表数据时,比如csv这种类型的,需要跳过行首或者行尾一些和数据无关的或者自 ...

随机推荐

理解Object.defineProperty的作用
对象是由多个名/值对组成的无序的集合.对象中每个属性对应任意类型的值.定义对象可以使用构造函数或字面量的形式: var obj = new Object; //obj = {} obj.name = ...
CSS样式中常用的字体名称
css中引入字体: @font-face { font-family: "AncientWar"; src: url('style/css/fonts/AncientWar.ttf ...
浅谈python中的闭包函数
闭包函数初探通常我们定义函数都是这样定义的 def foo(): pass 其实在函数式编程中,函数里面还可以嵌套函数,如下面这样 def foo(): print("hello worl ...
HTML基础知识概括
1.html的概念 HTML是用来描述网页的一种语言. HTML指的是超文本标记语言(HyperText Markup Language) HTML不是一种编程语言,而是一种标记语言(markup l ...
浅谈OSI七层模型及ICP/IP四层模型
1.OSI七层模型的概念在网络历史的早期,国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)共同出版了开放系统互联的七层参考模型. 一台计算机操作系统中的网络过程包括从应用请求(在协议栈 ...
NOIP2016提高组初赛（C++语言）试题个人的胡乱分析 Part 2.
洛谷秋令营day1模拟赛原地爆炸,心态崩了.于是打算写一下初赛题放松一下. 上次胡乱分析到了选择题,这次我想说说后面的题. 问题求解 T1.有一个1x8的方格图形,黑白两色填涂每个方格,两个黑格并不能 ...
C# 简单内存补丁
写在开头:看了一些视频教程,感觉OD为什么别人学个破解那么容易,我就那么难了呢,可能是没有那么多时间吧. 解释:个人见解:所谓内存补丁,即:通过修改运行程序的内容,来达到某种目的的操作.修改使用Ope ...
似懂非懂的Comparable与Comparator
jdk1.8.0_41 一知半解写代码, 集合排序用个啥. 抄起键盘胡乱打, 似懂非懂最可怕. Comparable与Comparator都是用于集合的排序,对于大多数人来说Comparator可能略 ...
a元素的两个重要功能和表格布局
⦁ 发送邮件:<a href="mailto:231455557@qq.com">联系我们</a> ⦁ 锚点两个重要应用:查看目录提供菜单功能回到顶 ...
ionic2+Angular web端实现微信分享以及如何跳转回分享出去的页面
微信分享,首先参考微信JS-SDK开发文档. step1:在启动文件index.html中引入微信js文件: <script src="http://res.wx.qq.com/ope ...

hive： insert数据时Error during job, obtaining debugging information 以及beyond physical memory limits

hive： insert数据时Error during job, obtaining debugging information 以及beyond physical memory limits的更多相关文章

随机推荐

热门专题