执行HiveSQL出现的问题

-- ::, INFO [main] org.apache.hadoop.hive.ql.exec.ReduceSinkOperator: RECORDS_OUT_INTERMEDIATE:,

-- ::, FATAL [main] org.apache.hadoop.mapred.YarnChild: Error running child : java.lang.OutOfMemoryError: Java heap space

    at org.apache.orc.impl.DynamicByteArray.get(DynamicByteArray.java:)

    at org.apache.orc.impl.TreeReaderFactory$StringDictionaryTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$StringTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$ListTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$StructTreeReader.nextBatch(TreeReaderFactory.java:)

    at org.apache.orc.impl.RecordReaderImpl.nextBatch(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.RecordReaderImpl.ensureBatch(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.RecordReaderImpl.hasNext(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:)

    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:)

    at org.apache.hadoop.hive.ql.io.HiveContextAwareRecordReader.doNext(HiveContextAwareRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.CombineHiveRecordReader.doNext(CombineHiveRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.CombineHiveRecordReader.doNext(CombineHiveRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.HiveContextAwareRecordReader.next(HiveContextAwareRecordReader.java:)

    at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.doNextWithExceptionHandler(HadoopShimsSecure.java:)

    at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.next(HadoopShimsSecure.java:)

    at org.apache.hadoop.mapred.MapTask$TrackedRecordReader.moveToNext(MapTask.java:)

    at org.apache.hadoop.mapred.MapTask$TrackedRecordReader.next(MapTask.java:)

    at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:)

    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:)

    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:)

    at org.apache.hadoop.mapred.YarnChild$.run(YarnChild.java:)

    at java.security.AccessController.doPrivileged(Native Method)

    at javax.security.auth.Subject.doAs(Subject.java:)

    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)

    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:)

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: Stopping MapTask metrics system...

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: MapTask metrics system stopped.

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: MapTask metrics system shutdown complete.

这就是堆内存溢出。

看看yarn-site.xml 的配置

<property>

    <name>yarn.nodemanager.resource.memory-mb</name>

    <value>24576</value>

    <!-- 每个节点可用内存，配置为24G 限制了NodeManager 从本机中申请内存的上限-->

  </property>

  <property>

    <name>yarn.scheduler.maximum-allocation-mb</name>

    <value>16384</value>

    <!-- 单个任务最大可申请内存16G，这里只是进行了一个限制，也就是不能超过它，如果超过了会被kill-->

  </property>

  <property>

    <name>yarn.scheduler.minimum-allocation-mb</name>

    <value>2048</value>

    <!-- 单个任务可申请的最小内存2G,这是只是进行了一个限制，如果是map任务还需要在mapred-site.xml 再次设置  -->

  </property>

  <property>

    <name>yarn.nodemanager.vmem-check-enabled</name>

    <value>false</value>

    <!-- 关闭检查虚拟内存量 -->

  </property>

看看mapred-site.xml

  <property>

    <name>mapreduce.map.memory.mb</name>

    <value>4096</value>

    <!-- map 任务最大内存 -->

  </property>

  <property>

    <name>mapreduce.reduce.memory.mb</name>

    <value>4096</value>

    <!-- reduce 任务最大内存 -->

  </property>

  <property>

    <name>mapred.child.java.opts</name>

    <value>-Xmx2048m</value>

    <!-- JVM 虚拟机的启动参数 -->

  </property>

一直没找到原因；然后就想到了是不是hive 自身的问题；

终于找到了解决方案，在执行HiveSQL 之前进行一下设置

set mapreduce.map.java.opts=-Xmx2048m;

-- 然后在执行sql

select * from xxx

执行HiveSQL出现的问题的更多相关文章

大数据计算新贵Spark在腾讯雅虎优酷成功应用解析
http://www.csdn.net/article/2014-06-05/2820089 摘要:MapReduce在实时查询和迭代计算上仍有较大的不足,目前,Spark由于其可伸缩.基于内存计算等 ...
spark第一篇--简介，应用场景和基本原理
摘要: spark的优势:(1)图计算,迭代计算(2)交互式查询计算 spark特点:(1)分布式并行计算框架(2)内存计算,不仅数据加载到内存,中间结果也存储内存为了满足挖掘分析与交互式实时查询的 ...
Azkaban各种类型的Job编写
一.概述原生的 Azkaban 支持的plugin类型有以下这些: command:Linux shell命令行任务 gobblin:通用数据采集工具 hadoopJava:运行hadoopMR任务 ...
Azkaban
Azkaban安装部署 https://azkaban.github.io/azkaban/docs/2.5/ 安装Azkaban ) 在/opt/module/目录下创建azkaban目录 [kri ...
Hive命令参数
1.hive -h 显示帮助 2.hive -h hiveserverhost -p port 连接远程hive服务器 3.hive --define a=1 --hivevar b= ...
Azkaban任务流编写
在Azkaban中,一个project包含一个或多个flows,一个flow包含多个job.job是你想在azkaban中运行的一个进程,可以是Command,也可以是一个Hadoop任务.当然,如果 ...
HIVE-执行hive的几种方式，和把HIVE保存到本地的几种方式
网上相关教程很多,这里我主要是简单总结下几种常用的方法,方便日后查询. 第一种,在bash中直接通过hive -e命令,并用 > 输出流把执行结果输出到制定文件 hive -e "se ...
spark教程(八)-SparkSession
spark 有三大引擎,spark core.sparkSQL.sparkStreaming, spark core 的关键抽象是 SparkContext.RDD: SparkSQL 的关键抽象是 ...
hive三种调用方式
一.hive -e ‘sql语句’ (shell命令) 适合比较短的sql语句调用,优点是可以直接在shell中调用静音模式 -S 在执行HiveQL过程中,不在显示器输出MR的执行过程hive -S ...

随机推荐

Python预测2020高考分数和录取情况可能是这样
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:打磨虾 “迟到”了一个月的高考终于要来了. 正好我得到了一份山东新高 ...
day12 文件操作（下）
目录一.x模式(控制文件操作模式,与rwa同级) 1 特点 2 格式二.b模式(控制文件读写内容的模式,与t同级) 1.b模式和t模式的区别 2 b模式应用 3 循环读取文件三.文件操作的其他方 ...
nginx限制访问域名，禁止IP访问
有些时候我们希望系统只能通过固定的域名访问,禁止IP或者恶意绑定的域名访问. 下面的nginx配置,假如host变量不是指定的域名,将返回403. server { listen 80; server ...
攻防世界FlatScience
访问robots.txt发现 admin.php和login.php 在admin.php和login.php分别尝试注入发现login.php页面存在注入,并且根据报错得知数据库类型为sqlite ...
SQLAlchemy03 /外键、连表关系
SQLAlchemy03 /外键.连表关系目录 SQLAlchemy03 /外键.连表关系 1.外键 2.ORM关系以及一对多 3.一对一的关系 4.多对多的关系 5.ORM层面的删除数据 6.OR ...
机器学习实战基础（二十三）：sklearn中的降维算法PCA和SVD（四） PCA与SVD 之 PCA中的SVD
PCA中的SVD 1 PCA中的SVD哪里来? 细心的小伙伴可能注意到了,svd_solver是奇异值分解器的意思,为什么PCA算法下面会有有关奇异值分解的参数?不是两种算法么?我们之前曾经提到过,P ...
数据可视化之分析篇（七）Power BI数据分析应用：水平分析法
https://zhuanlan.zhihu.com/p/103264851 首先,以财务报表分析为例,介绍通用的分析方法论,整体架构如下图所示: (点击查看大图) 接下来我会围绕这五种不同的方法论, ...
How to install chinese input method
在Ubuntu中安装中文输入法确实比较麻烦,特别是英文版的Ubuntu系统 Ubuntu上的输入法主要有小小输入平台(支持拼音/二笔/五笔等),Fcitx,Ibus,Scim等.其中Scim和Ib ...
c++运行程序鼠标点击按钮 (c++)(windows)
简介这是在黑漆漆的程序中,制造用户可点击的按钮,来决定程序下一步该作什么,的基本代码. 详解头文件 <cstdio>和<windows.h> 结构体 //这不全别复制 st ...
js 分享QQ、QQ空间、微信、微博
//分享QQ好友 function qq(title,url,pic) { var p = { url: 'http://test.qicheyitiao.com',/*获取URL,可加上来自分享到Q ...

执行HiveSQL出现的问题

执行HiveSQL出现的问题的更多相关文章

随机推荐

热门专题