执行HiveSQL出现的问题

-- ::, INFO [main] org.apache.hadoop.hive.ql.exec.ReduceSinkOperator: RECORDS_OUT_INTERMEDIATE:,

-- ::, FATAL [main] org.apache.hadoop.mapred.YarnChild: Error running child : java.lang.OutOfMemoryError: Java heap space

    at org.apache.orc.impl.DynamicByteArray.get(DynamicByteArray.java:)

    at org.apache.orc.impl.TreeReaderFactory$StringDictionaryTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$StringTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$ListTreeReader.nextVector(TreeReaderFactory.java:)

    at org.apache.orc.impl.TreeReaderFactory$StructTreeReader.nextBatch(TreeReaderFactory.java:)

    at org.apache.orc.impl.RecordReaderImpl.nextBatch(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.RecordReaderImpl.ensureBatch(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.RecordReaderImpl.hasNext(RecordReaderImpl.java:)

    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:)

    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$OrcRecordReader.next(OrcInputFormat.java:)

    at org.apache.hadoop.hive.ql.io.HiveContextAwareRecordReader.doNext(HiveContextAwareRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.CombineHiveRecordReader.doNext(CombineHiveRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.CombineHiveRecordReader.doNext(CombineHiveRecordReader.java:)

    at org.apache.hadoop.hive.ql.io.HiveContextAwareRecordReader.next(HiveContextAwareRecordReader.java:)

    at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.doNextWithExceptionHandler(HadoopShimsSecure.java:)

    at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.next(HadoopShimsSecure.java:)

    at org.apache.hadoop.mapred.MapTask$TrackedRecordReader.moveToNext(MapTask.java:)

    at org.apache.hadoop.mapred.MapTask$TrackedRecordReader.next(MapTask.java:)

    at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:)

    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:)

    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:)

    at org.apache.hadoop.mapred.YarnChild$.run(YarnChild.java:)

    at java.security.AccessController.doPrivileged(Native Method)

    at javax.security.auth.Subject.doAs(Subject.java:)

    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)

    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:)

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: Stopping MapTask metrics system...

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: MapTask metrics system stopped.

-- ::, INFO [main] org.apache.hadoop.metrics2.impl.MetricsSystemImpl: MapTask metrics system shutdown complete.

这就是堆内存溢出。

看看yarn-site.xml 的配置

<property>

    <name>yarn.nodemanager.resource.memory-mb</name>

    <value>24576</value>

    <!-- 每个节点可用内存，配置为24G 限制了NodeManager 从本机中申请内存的上限-->

  </property>

  <property>

    <name>yarn.scheduler.maximum-allocation-mb</name>

    <value>16384</value>

    <!-- 单个任务最大可申请内存16G，这里只是进行了一个限制，也就是不能超过它，如果超过了会被kill-->

  </property>

  <property>

    <name>yarn.scheduler.minimum-allocation-mb</name>

    <value>2048</value>

    <!-- 单个任务可申请的最小内存2G,这是只是进行了一个限制，如果是map任务还需要在mapred-site.xml 再次设置  -->

  </property>

  <property>

    <name>yarn.nodemanager.vmem-check-enabled</name>

    <value>false</value>

    <!-- 关闭检查虚拟内存量 -->

  </property>

看看mapred-site.xml

  <property>

    <name>mapreduce.map.memory.mb</name>

    <value>4096</value>

    <!-- map 任务最大内存 -->

  </property>

  <property>

    <name>mapreduce.reduce.memory.mb</name>

    <value>4096</value>

    <!-- reduce 任务最大内存 -->

  </property>

  <property>

    <name>mapred.child.java.opts</name>

    <value>-Xmx2048m</value>

    <!-- JVM 虚拟机的启动参数 -->

  </property>

一直没找到原因；然后就想到了是不是hive 自身的问题；

终于找到了解决方案，在执行HiveSQL 之前进行一下设置

set mapreduce.map.java.opts=-Xmx2048m;

-- 然后在执行sql

select * from xxx

执行HiveSQL出现的问题的更多相关文章

大数据计算新贵Spark在腾讯雅虎优酷成功应用解析
http://www.csdn.net/article/2014-06-05/2820089 摘要:MapReduce在实时查询和迭代计算上仍有较大的不足,目前,Spark由于其可伸缩.基于内存计算等 ...
spark第一篇--简介，应用场景和基本原理
摘要: spark的优势:(1)图计算,迭代计算(2)交互式查询计算 spark特点:(1)分布式并行计算框架(2)内存计算,不仅数据加载到内存,中间结果也存储内存为了满足挖掘分析与交互式实时查询的 ...
Azkaban各种类型的Job编写
一.概述原生的 Azkaban 支持的plugin类型有以下这些: command:Linux shell命令行任务 gobblin:通用数据采集工具 hadoopJava:运行hadoopMR任务 ...
Azkaban
Azkaban安装部署 https://azkaban.github.io/azkaban/docs/2.5/ 安装Azkaban ) 在/opt/module/目录下创建azkaban目录 [kri ...
Hive命令参数
1.hive -h 显示帮助 2.hive -h hiveserverhost -p port 连接远程hive服务器 3.hive --define a=1 --hivevar b= ...
Azkaban任务流编写
在Azkaban中,一个project包含一个或多个flows,一个flow包含多个job.job是你想在azkaban中运行的一个进程,可以是Command,也可以是一个Hadoop任务.当然,如果 ...
HIVE-执行hive的几种方式，和把HIVE保存到本地的几种方式
网上相关教程很多,这里我主要是简单总结下几种常用的方法,方便日后查询. 第一种,在bash中直接通过hive -e命令,并用 > 输出流把执行结果输出到制定文件 hive -e "se ...
spark教程(八)-SparkSession
spark 有三大引擎,spark core.sparkSQL.sparkStreaming, spark core 的关键抽象是 SparkContext.RDD: SparkSQL 的关键抽象是 ...
hive三种调用方式
一.hive -e ‘sql语句’ (shell命令) 适合比较短的sql语句调用,优点是可以直接在shell中调用静音模式 -S 在执行HiveQL过程中,不在显示器输出MR的执行过程hive -S ...

随机推荐

SpringBoot + Vue + ElementUI 实现后台管理系统模板 -- 后端篇（五）：数据表设计、使用 jwt、redis、sms 工具类完善注册登录逻辑
(1) 相关博文地址: SpringBoot + Vue + ElementUI 实现后台管理系统模板 -- 前端篇(一):搭建基本环境:https://www.cnblogs.com/l-y-h/p ...
python使用数组实现链表的策略分析
python实现链表数据结构:数组/节点与引用使用数组策略: 使用数组存储指向其他对象的引用数组存储空间过度分配数组填满后,分配一个更大的数组,将旧数组的内容复制到新数组中 class Arra ...
仿Neo4j里的知识图谱，利用d3+vue开发的一个网络拓扑图
项目需要画一个类似知识图谱的节点关系图. 一开始用的是echart画的. 根据https://gallery.echartsjs.com/editor.html?c=xH1Rkt3hkb,成功画出简单 ...
一篇夯实一个知识点系列－－python装饰器
写在前面本系列目的:希望可以通过一篇文章,不望鞭辟入里,但求在工程应用中得心应手. 装饰器模式是鼎鼎大名的23种设计模式之一.装饰器模式可以在不改变原有代码结构的情况下,扩展代码功能. Python ...
java 面向对象（十）：关键字：this
1.可以调用的结构:属性.方法:构造器2.this调用属性.方法:this理解为:当前对象或当前正在创建的对象 2.1 在类的方法中,我们可以使用"this.属性"或" ...
操作句柄Handle（7）
可以将Handle理解成访问对象的一个“句柄”.垃圾回收时对象可能被移动(对象地址发生改变),通过Handle访问对象可以对使用者屏蔽垃圾回收细节. Handle涉及到的相关类的继承关系如下图所示. ...
Burp Suite Decoder Module - 解码模块
官方参考链接:https://portswigger.net/burp/documentation/desktop/tools/decoder 该模块主要进行编码和解码,支持编码方式有:Plain,U ...
create-react-app中的babel配置探索
版本 babel-loader version:"8.1.0" create-react-app:"3.4.1" 三个配置第一部分: { test: /\.( ...
java opencsv解析csv文件
记一次使用opencsv解析csv文件时碰到的坑最近在开发过程中需要解析csv文件,公司用的解析工具是opencsv,在根据opencsv的官方文档去解析时发现csv文件中含有繁体字,使用其自带的C ...
如何获取json某一级节点的数据
如何获取json某一级节点的数据最近做项目有获取和设置固定格式某一级节点值的需求.但是要一级一级地取对于多级的结构来说代码过于冗余且重复,于是写了个递归的方法根据json路径完成值的定点操作.废话不 ...

执行HiveSQL出现的问题

执行HiveSQL出现的问题的更多相关文章

随机推荐

热门专题